制約付きブートストラッピング法による特徴語抽出について(検索,第1回テキストマイニング・シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
Googleのランキング手法を文書と単語について応用したブートストラッピング法がある。単語と文書の重要度を相互に伝搬させ、大局的な重要度を求める。しかし、結果が検索語から乖離する「トピックドリフト」という問題があり、本質的な解決方法は知られていない。本稿では、単語集合と文書集合を相互に求める過程で、上位の単語に制約する方式を提案する。単語の出現パターンを限定するなどの従来手法と比べ、単純で一般的な方法である。倒産情報文書群を対象とした実験により、トピックドリフトを防ぎ、検索語に強く関連する倒産理由を抽出できることが確認できた。
- 2011-06-30
著者
関連論文
- 証明探索と反例生成を同時に行なうアルゴリズムについて
- クリプケモデル生成とJavaアプレットとしての実現
- Web データベースにおける入力フォーム情報の自動抽出
- ウェブデータウエアハウスと協働する業務報告書オーサリングシステム
- 初等幾何推論の多面的表示方式
- ZKネットワーク雑記帳
- 具体的な図を用いる初等幾何推論システム
- $\lambda_C$計算と$\lambda_P$計算との対応(計算理論とその応用)
- 分散する機能利用を支援するJavaを用いた対話環境
- 複雑な知識モデルを利用した人間の学習プロセスシミュレーションの検討
- クロス集計による文献ファセット検索システムの提案
- 二つの観点に基く検索結果の分析方法Double Rankについて(検索,第1回テキストマイニング・シンポジウム)
- 制約付きブートストラッピング法による特徴語抽出について(検索,第1回テキストマイニング・シンポジウム)
- 観光ブログからの地名抽出と曖昧性解消
- クロス集計による文献ファセット検索システムの提案 (情報処理学会第104回情報基礎とアクセス技術研究会(IFAT)発表論文)
- Crowdsourcing Systemを用いた略語の推定手法の提案 (言語理解とコミュニケーション)
- Crowdsourcing Systemを用いた略語の推定手法の提案 (音声)
- 日韓オノマトペの抽出とその感性評価利用
- 少数例による学習における属性選択の効果について