大規模テストコレクション構築について : NTCIR-1の訓練用検索課題の分析
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、評価用ツールとしてのテストコレクションにおける検索課題の性質について考察する。検索課題の望ましい性質として、「自然さ」と「難易度のバランス」があげられる。自然さとは、検索課題の内容が現実の検索過程においてシステムに与えられる検索要求と同様に自然なものでなければならないということである。「難易度のバランス」とは、検索課題が易しいすぎるものばかりでも難しすぎるものばかりでも、テストコレクション全体の性質が偏ったものになるので、難易度のバランスがとれているのが望ましいということである。 NTCIR-1では、検索課題を自然なものとするため、分野の研究者から収集している。本稿では、検索課題の難易度について、NTCIR-1の訓練用検索課題を用いて、検索課題そのものについて分析し、予備テストの評価結果との関連を調べた。 その結果、検索課題ごとの平均精度の中央値と、検索課題中の検索要求文の文字数、検索要求文中の単語がの出現する正解文書数、機能分類のそれぞれとには明らかな関連性は見られないものの、機能分類によるグループ分けは検索課題の難易度を予測するために、ある程度の参考になることがわかった。また、提出結果の平均精度の度数分布から、易しい検索課題、難しい検索課題というグループ分けの中でもその性質は一様ではないことがわかった。
- 一般社団法人情報処理学会の論文
- 1999-07-16
著者
関連論文
- 〈情報処理学会 情報学基礎研究会 (F1) 第96回 発表論文〉 Q&Aサイトにおける質問と回答の分析(2) : 文の構造と属性を中心に (筑波大学東京キャンパス(秋葉原地区). 2009年11月19日)
- 〈発表論文〉 NTCIR-3 言語横断検索タスクの分析 : プーリングを中心として (情報処理学会 情報学基礎研究会(FI) 第73回)
- NTCIR-3言語横断検索タスクの分析 : プーリングを中心として
- 大規模テストコレクション構築のためのプーリング : NTCIR-3言語横断検索タスクの分析(コーパス分析・言い換え)(セマンティックウェブと自然言語処理その他一般)
- 〈情報処理学会 第100回情報基礎とアクセス技術研究会(IFAT) 発表論文〉Q&Aサイトにおける質問と回答の分析(4) : 質問タイプ分類の一致度について(立命館大学 びわこ・くさつキャンパス エポック立命21. 2010年11月4日)
- オンラインジャーナル編集・出版システムの開発
- オンラインジャーナル出版システム
- Q&Aサイトにおけるベストアンサー推定の分析とその機械学習への応用
- Q&Aサイトにおける質問と回答の分析(4)-質問タイプ分類の一致度について-
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- 大規模テストコレクションNTCIR-2の構築 : 対話型追加検索と言語横断的プーリングの効果(情報の検索とテストコレクション)
- 多段階レレバンス判定による評価 : 平均可能な単一指標の検討
- 大規模テストコレクションNTCIR-2の構築 : 言語横断的プーリングの評価への影響
- 大規模テストコレクションNTCIR-1 NTCIR-2 : レコードから見た違い
- 大規模テストコレクション NTCIR-1 と NTCIR-2 : レコードから見た違い
- 情報検索サービスNACSIS-IRの新たな展開 (情報検索の新潮流)
- Q&Aサイトにおける質問と回答の分析(3)-質問・回答履歴を用いたベストアンサー推定-
- Q&Aサイトにおける質問と回答の分析(3)-質問・回答履歴を用いたベストアンサー推定-
- 第1回NTCIRワークショップ:情報検索・用語抽出の評価会議
- 情報検索システムの評価 : テストコレクションと評価ワークショップ (情報検索の新潮流)
- レレバンスをめぐる一考察 : NTCIRの背景として
- Q&Aサイトにおける質問と回答の分析(2)-文の構造と属性を中心に-
- RD-003 コミュニティQAにおける良質な回答の選定タスク : 評価方法に関する考察(D分野:データベース,査読付き論文)
- オンラインジャーナル出版システム
- 情報アクセス技術の性能評価のための研究基盤NTCIR : 言語横断検索の創成と展開(NTCIR特別セッション)
- 情報アクセス技術の性能評価のための研究基盤NTCIR : 言語横断検索の創成と展開(NTCIR特別セッション)
- NTCIR-3 言語横断検索タスクの分析 : プーリングを中心として
- 大規模テストコレクション構築のためのプーリング : NTCIR-3言語横断検索タスクの分析
- NACSIS-IRの検索機能の高度化
- NTCIR-3 WEB : Web 検索のための評価ワークショップ(電子文書処理)
- 検索課題の難易度を考慮したテキスト検索システムの評価(情報の検索とテストコレクション)
- Web検索チャレンジの課題 : NTCIRワークショップ3の新タスク
- テストコレクションにおける検索課題の難易度予測への挑戦
- タスク種別とユーザ特性の違いが Web 情報探索行動に与える影響 : 眼球運動データおよび閲覧行動ログを用いた分析
- Q&Aサイトにおける質問と回答の分析
- Q&Aサイトにおける質問と回答の分析
- 情報検索システムの評価 : テストコレクションを中心に(図書館・情報活動と)
- 複数国の新聞サイトを比較分析するNSContrastの実験的分析
- 複数国の新聞サイトを比較分析するNSContrastの実験的分析
- 世界の電子図書館の研究動向について
- 画像の認知の枠組みと索引法
- 情報検索、情報抽出テストコレクション
- シソーラスを用いた検索式拡張の評価
- シソーラスを用いた検索式拡張の評価
- Web情報探索前後のコンセプトマップの分析:探索者によるノード同定結果を用いて
- 2000-FI-59-4 / 2000-DD-24-4 大規模テストコレクションNTCIR-1における検索課題の難易度に関する分析
- 2000-FI-59-4 / 2000-DD-24-4 大規模テストコレクションNTCIR-1における検索課題の難易度に関する分析
- 大規模テストコレクション構築のためのプーリングについて :NTCIR-1の分析
- 4P-2 大規模テストコレクションNTCIR-1の構築(2) : 検索課題の分析
- 4P-1 大規模テストコレクションNTCIR-1の構築(1) : プーリングと正解判定の分析
- NTCIR-1 : 情報検索システム評価用テストコレクション構築の方針と実際
- 複数判定者によるコミュニティQAの良質回答の判定
- コミュニティQAにおける質問の多面的評価法の検討
- 情報検索の前後におけるユーザの知識構造の変化 : コンセプトマップを使った分析
- 5K-2 クラスタにおける選択的情報に基づくクエリ拡張
- コミュニティQAにおける良質回答の自動予測
- 〈情報処理学会第104回情報基礎とアクセス技術研究会(IFAT) 発表論文〉 Web情報探索前後のコンセプトマップの分析 : 探索者によるノード同定結果を用いて
- NTCIR-9総括と今後の展望
- NTCIR-9総括と今後の展望
- 情報要求の言語化を支援するクエリ拡張型Web検索システムに関する一検討 (データベース Vol.4 No.3)
- Wikipediaカテゴリを用いたWikipediaとGeoNames間のリンク発見とメンテナンス
- コミュニティQAを用いたクエリ拡張のためのコンテキスト抽出に関する一考察
- 情報検索システム評価用テストコレクション (特集 情報検索)
- 大規模テストコレクション構築について : NTCIR-1の訓練用検索課題の分析
- 大規模テストコレクション構築について : NTCIR-1の訓練用検索課題の分析
- 大規模テストコレクション構築のためのプーリングについて : NTCIR-1の予備テストの分析
- 日中ブロガー・コミュニティの収集・俯瞰・対照分析
- 日中ブロガー・コミュニティの収集・俯瞰・対照分析