シソーラスを用いた語の共起関係推定によるRocchioフィードバックの精度向上(<特集>システムLSIの設計技術と設計自動化)
スポンサーリンク
概要
- 論文の詳細を見る
Rocchioフィードバックの検索精度を向上する手段として,決定木学習アルゴリズムID3を用いて文書から検索語間の重要な共起関係を抽出し,検索結果に反映させる手法が報告されている.しかし従来手法では質問文中の検索語間の共起のみを扱っていたため,文書中にのみ登場する語を含む共起関係は抽出されなかった.そのため質問文に登場しなければ,検索語の類義語や質問に関連する語であっても,これらを含む共起関係が抽出されることはなかった.本稿ではシソーラスを用いた概念学習により,概念を含む共起関係を抽出することで,類義語を含む共起関係を抽出する.さらに概念分類が粗い場合に重要な共起関係が抽出できない可能性があるため,シソーラスの分類より細かい分類を推定し,共起関係推定の対象とする.提案手法をOHSUMEDテストコレクションを用いて評価したところ,検索語の組合せだけではサンプル中の必要文書と不要文書を判別できない場合において,Rocchioフィードバックと比較して上位10件での適合率を10%程度向上させることができた.
- 一般社団法人情報処理学会の論文
- 2002-05-15
著者
関連論文
- 質問応答システムの比較と評価
- 類似学習例の除外とRocchioフィードバックを弱学習アルゴリズムとするAdaBoostによるレレバンスフィードバックの精度向上
- シソーラスを用いた語の共起関係推定によるRocchioフィードバックの精度向上(システムLSIの設計技術と設計自動化)