コミュニティQAにおける良質回答の自動予測
スポンサーリンク
概要
- 論文の詳細を見る
コミュニティ型質問応答サイト(CQA)は,ユーザが自身の状況に応じた情報を得ることができる新たな手段である.しかし投稿された回答の質は様々であるため,その中から良質な回答を選択する方法が求められている.そこで本研究は,まず Yahoo!知恵袋データにおける良質回答を人手で分析し,その結果に基づいて良質回答自動予測システムを構築した.具体的には,「恋愛相談」「パソコン」「一般教養」「政治」の4つのカテゴリからそれぞれ無作為に50問の質問を抽出し,判定者2名によって手作業で良質回答を決定した.次に,その結果を分析し,良質回答の特徴として「詳しさ」「根拠」「丁寧さ」に基づく機械学習システムを構築した.機械学習システムの評価結果は,「パソコン」と「一般教養」カテゴリでは判定者らを上回った.「恋愛相談」と「政治」カテゴリでは,機械学習システムの評価結果は判定者らとほぼ同じであった.以上の結果から,CQAアーカイブから自動的に良質回答を発見するシステムの可能性が示唆される.
著者
-
石川 大介
国立情報学研究所
-
栗山 和子
白百合女子大学
-
神門 典子
国立情報学研
-
酒井 哲也
マイクロソフト リサーチ アジア
-
関 洋平
筑波大学
-
関 洋平
筑波大学大学院図書館情報メディア研究科
-
関 洋平
筑波大学大学院 図書館情報メディア研究科
関連論文
- Qサイトにおけるベストアンサー推定の分析とその機械学習への応用
- 〈情報処理学会 情報学基礎研究会 (F1) 第96回 発表論文〉 Q&Aサイトにおける質問と回答の分析(2) : 文の構造と属性を中心に (筑波大学東京キャンパス(秋葉原地区). 2009年11月19日)
- 目次と帯を用いた図書の自動分類(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 意見保有者の判別 : NTCIR意見分析タスクにおける試み(「主観表現処理の最前線」シンポジウム)
- NTCIR-3言語横断検索タスクの分析 : プーリングを中心として
- 大規模テストコレクション構築のためのプーリング : NTCIR-3言語横断検索タスクの分析(コーパス分析・言い換え)(セマンティックウェブと自然言語処理その他一般)
- LL_011 コンテンツを組織化する知識コンテンツ構築システムの提案(L分野:ネットワークコンピューティング)
- 協調学習のためのコンテンツ構築システムEduWikiの開発(セッション7: 社会システム・教育支援システム)
- NTCIR-7速報(NTCIR特別セッション)
- サーチエンジン検索結果ページにおける視線情報の分析(第17回(2009年度)年次大会(研究報告会&総会))
- 〈情報処理学会 第100回情報基礎とアクセス技術研究会(IFAT) 発表論文〉Q&Aサイトにおける質問と回答の分析(4) : 質問タイプ分類の一致度について(立命館大学 びわこ・くさつキャンパス エポック立命21. 2010年11月4日)
- Concentric Ring View F+ : マルチメディアデータのためのリング状検索インタフェース(ユーザインタフェースとインタラクティブシステム)
- Concentric Ring View F+ : マルチメディアデータのためのリング状検索インタフェース
- Q&Aサイトにおけるベストアンサー推定の分析とその機械学習への応用
- NTCIRにおける質問応答技術の評価と今後の展望(NTCIR特別セッション)
- Basic Elementを用いた質問応答の自動評価(情報検索・情報抽出・QA)
- Web情報探索における視線データの予備的分析(創立20周年記念 第16回(2008年度)年次大会(研究報告会&総会))
- 多面的な検索とブラウジングを統合したGUI(セッション3 : GUIデザイン)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 情報アクセス対話のための質問応答技術評価タスク
- NTCIRにおける質問応答技術の評価と今後の展望(NTCIR特別セッション)
- Basic Elementを用いた質問応答の自動評価(情報検索・情報抽出・QA)
- 目次と帯を用いた図書の自動分類(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 動向情報の要約と可視化とその展開 : MuST(動向情報の要約と可視化に関するワークショップ)活動報告(言い換え・略語・要約)
- 動向情報の要約と可視化 : 言葉と図で情報をまとめる
- NTCIR-4における類似特許検索テストコレクションの構築(テキスト検索,分類)
- 特許コーパスを用いた検索タスクの提案
- Q&Aサイトにおける質問と回答の分析(4)-質問タイプ分類の一致度について-
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Web上のexploratory searchの特徴:発話プロトコルと事後インタビュー分析結果より
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- Wikipediaを介した関連ニュース・ブログの対応付け? Wikipediaエントリの分析?
- 特定トピックの日英ブログ収集・分析・類型化:事例研究
- 特集「NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ」にあたって(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- 大規模テストコレクションNTCIR-2の構築 : 対話型追加検索と言語横断的プーリングの効果(情報の検索とテストコレクション)
- 多段階レレバンス判定による評価 : 平均可能な単一指標の検討
- 大規模テストコレクションNTCIR-2の構築 : 言語横断的プーリングの評価への影響
- 大規模学術情報データベースに適した情報検索システムの開発
- 大規模テストコレクションNTCIR-1 NTCIR-2 : レコードから見た違い
- 大規模テストコレクション NTCIR-1 と NTCIR-2 : レコードから見た違い
- 小学生の語彙特性と専門用語に着目した言い換え箇所の分析
- Q&Aサイトにおける質問と回答の分析(3)-質問・回答履歴を用いたベストアンサー推定-
- Q&Aサイトにおける質問と回答の分析(3)-質問・回答履歴を用いたベストアンサー推定-
- Q&Aサイトにおける質問と回答の分析(2)-文の構造と属性を中心に-
- RD-003 コミュニティQAにおける良質な回答の選定タスク : 評価方法に関する考察(D分野:データベース,査読付き論文)
- 5J-6 キーワードのバースト特性を利用したスパムブログデータセットの作成と分析(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Link Depth : Web情報探索行動の閲覧パターンの分析
- Link Depth : Web情報探索行動の閲覧パターンの分析
- Q&Aサイトにおける質問と回答の分析(3) : 質問・回答履歴を用いたベストアンサー推定
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- Q&Aサイトにおける質問と回答の分析(3) : 質問・回答履歴を用いたベストアンサー推定
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- 情報アクセス技術の性能評価のための研究基盤NTCIR : 言語横断検索の創成と展開(NTCIR特別セッション)
- 情報アクセス技術の性能評価のための研究基盤NTCIR : 言語横断検索の創成と展開(NTCIR特別セッション)
- NTCIR-3 言語横断検索タスクの分析 : プーリングを中心として
- 大規模テストコレクション構築のためのプーリング : NTCIR-3言語横断検索タスクの分析
- 情報アクセス対話に向けた質問応答技術の評価ふたたび : NTCIR-5 QAC3での試み(文書処理,質問応答)
- リスト型質問応答の特徴付けと評価指標(質問応答)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- リスト型質問応答の特徴付けと評価指標(質問応答)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 質問応答技術は情報アクセス対話を実現できるか(質問応答)
- 情報検索と要約の評価 : 第2回NTCIRワークショップ概要
- 意見文に関する情報付与と意見に焦点を当てた要約の関係の分析(要約)
- 意見文に関する情報付与と意見に焦点を当てた要約の関係の分析(要約)
- 利用者の情報要求を考慮した観点に基づく複数文書要約とその評価
- 感情表現の抽出手法に関する提案(表理解,アライメント,抽出)
- 感情表現の抽出手法に関する提案(表理解,アライメント,抽出)
- 事実・意見・知識に焦点を当てた観点に基づく複数文書要約(複数文書の処理)
- NTCIR-3 WEB : Web 検索のための評価ワークショップ(電子文書処理)
- 検索課題の難易度を考慮したテキスト検索システムの評価(情報の検索とテストコレクション)
- Web検索チャレンジの課題 : NTCIRワークショップ3の新タスク
- テストコレクションにおける検索課題の難易度予測への挑戦
- タスク種別とユーザ特性の違いが Web 情報探索行動に与える影響 : 眼球運動データおよび閲覧行動ログを用いた分析
- 意見分析タスク : 多言語テキストを対象とした意見抽出技術の評価(NTCIR特別セッション)
- 意見分析タスク : 多言語テキストを対象とした意見抽出技術の評価(NTCIR特別セッション)
- Q&Aサイトにおける質問と回答の分析
- Q&Aサイトにおける質問と回答の分析
- コミュニティQAにおける質問の多面的評価法の検討
- 情報検索システムの評価 : テストコレクションを中心に(図書館・情報活動と)
- 複数国の新聞サイトを比較分析するNSContrastの実験的分析
- 複数国の新聞サイトを比較分析するNSContrastの実験的分析
- BEを用いた質問応答技術の自動評価(質問応答・要約,テキスト情報の要約と掲示に関わる自然言語処理シンポジウム及び一般)
- デジタルコンテンツ時代の図書館 : ─国際図書館連盟(IFLA)年次大会テーマの変遷から─
- 情報空間からの発見と新たな価値の創成
- 複数判定者によるコミュニティQAの良質回答の判定
- 情報検索の前後におけるユーザの知識構造の変化: : コンセプトマップを使った分析
- 論文間の参照情報を考慮した関連論文の組織化(21世紀のグループウェア)
- コミュニティQAにおける良質回答の自動予測
- Web情報探索前後のコンセプトマップの分析:探索者によるノード同定結果を用いて
- 理由に着目した感情表現の構成要素分析
- レビューにおける「理由」の分析 : 被験者実験より
- 理由に着目した感情表現の分析(感情音声・感情認知II, 感情表現・分析, 情動, 感情音声)
- 2000-FI-59-4 / 2000-DD-24-4 大規模テストコレクションNTCIR-1における検索課題の難易度に関する分析
- 2000-FI-59-4 / 2000-DD-24-4 大規模テストコレクションNTCIR-1における検索課題の難易度に関する分析
- 複数判定者によるコミュニティQAの良質回答の判定
- コミュニティQAにおける良質回答の自動予測