Qサイトにおけるベストアンサー推定の分析とその機械学習への応用
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,Q サイトにおけるベストアンサーを計算機が推定可能か検証した.まず最初に,人間の判定者によるベストアンサー推定実験を行った.ベストアンサー推定実験にはYahoo!知恵袋データを利用し,「恋愛相談」「パソコン」「一般教養」「政治」の4つのカテゴリからそれぞれ無作為抽出した50 問を使用した.判定者二人による推定結果の正解率(精度) は,「恋愛相談」では50%と52%(ランダム推定:34%),「パソコン」では62%と58%(ランダム推定:38%),「一般教養」では54%と56%(ランダム推定:37%),「政治」では56%と60%(ランダム推定:35.8%) であった.次に,この実験結果を分析し,ベストアンサーを選ぶ要因として「詳しい」「根拠」「丁寧」を素性とする機械学習システムを構築した.判定者らと同じ50 問を用いた推定実験の結果,機械学習システムの精度は,「パソコン」では判定者らの結果を上回り(67%),「恋愛相談」では判定者らの結果を下回った(41%).「一般教養」と「政治」では機械学習システムと判定者らの結果はほぼ同等であった.
著者
関連論文
- Qサイトにおけるベストアンサー推定の分析とその機械学習への応用
- 多重フーリエスペクトル表現に基づく三次元モデルの形状類似検索(コンテンツ技術,Web情報システム)
- BS-10-6 ESPARアンテナを用いた屋内における観測対象の位置推定(BS-10. ユビキタス・センサネットワークを支えるロケーション技術,シンポジウムセッション)
- 目次と帯を用いた図書の自動分類(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 意見保有者の判別 : NTCIR意見分析タスクにおける試み(「主観表現処理の最前線」シンポジウム)
- NTCIR-3言語横断検索タスクの分析 : プーリングを中心として
- 大規模テストコレクション構築のためのプーリング : NTCIR-3言語横断検索タスクの分析(コーパス分析・言い換え)(セマンティックウェブと自然言語処理その他一般)
- LL_011 コンテンツを組織化する知識コンテンツ構築システムの提案(L分野:ネットワークコンピューティング)
- 協調学習のためのコンテンツ構築システムEduWikiの開発(セッション7: 社会システム・教育支援システム)
- NTCIR-7速報(NTCIR特別セッション)
- 時系列情報の値と変化に関する言語表現コーパスの構築 : 動向情報の情報編纂に向けて
- タスク種別とユーザ特性の違いがWeb情報探索行動に与える影響: : 眼球運動データおよび閲覧行動ログを用いた分析
- サーチエンジン検索結果ページにおける視線情報の分析(第17回(2009年度)年次大会(研究報告会&総会))
- 〈情報処理学会 第100回情報基礎とアクセス技術研究会(IFAT) 発表論文〉Q&Aサイトにおける質問と回答の分析(4) : 質問タイプ分類の一致度について(立命館大学 びわこ・くさつキャンパス エポック立命21. 2010年11月4日)
- Concentric Ring View F+ : マルチメディアデータのためのリング状検索インタフェース(ユーザインタフェースとインタラクティブシステム)
- Concentric Ring View F+ : マルチメディアデータのためのリング状検索インタフェース
- Q&Aサイトにおけるベストアンサー推定の分析とその機械学習への応用
- NTCIRにおける質問応答技術の評価と今後の展望(NTCIR特別セッション)
- Basic Elementを用いた質問応答の自動評価(情報検索・情報抽出・QA)
- Web情報探索における視線データの予備的分析(創立20周年記念 第16回(2008年度)年次大会(研究報告会&総会))
- 多面的な検索とブラウジングを統合したGUI(セッション3 : GUIデザイン)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 情報アクセス対話のための質問応答技術評価タスク
- NTCIRにおける質問応答技術の評価と今後の展望(NTCIR特別セッション)
- Basic Elementを用いた質問応答の自動評価(情報検索・情報抽出・QA)
- 目次と帯を用いた図書の自動分類(情報検索・分類,テーマ : 「デジタルアーカイブの活用(応用)」および一般)
- 動向情報の要約と可視化とその展開 : MuST(動向情報の要約と可視化に関するワークショップ)活動報告(言い換え・略語・要約)
- 動向情報の要約と可視化 : 言葉と図で情報をまとめる
- NTCIR-4における類似特許検索テストコレクションの構築(テキスト検索,分類)
- 特許コーパスを用いた検索タスクの提案
- Q&Aサイトにおける質問と回答の分析(4)-質問タイプ分類の一致度について-
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Web上のexploratory searchの特徴:発話プロトコルと事後インタビュー分析結果より
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- Wikipediaを介した関連ニュース・ブログの対応付け? Wikipediaエントリの分析?
- 特定トピックの日英ブログ収集・分析・類型化:事例研究
- 特集「NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ」にあたって(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- 大規模テストコレクションNTCIR-2の構築 : 対話型追加検索と言語横断的プーリングの効果(情報の検索とテストコレクション)
- 多段階レレバンス判定による評価 : 平均可能な単一指標の検討
- 大規模テストコレクションNTCIR-2の構築 : 言語横断的プーリングの評価への影響
- 大規模学術情報データベースに適した情報検索システムの開発
- 大規模テストコレクションNTCIR-1 NTCIR-2 : レコードから見た違い
- 大規模テストコレクション NTCIR-1 と NTCIR-2 : レコードから見た違い
- Q&Aサイトにおける質問と回答の分析(3)-質問・回答履歴を用いたベストアンサー推定-
- Q&Aサイトにおける質問と回答の分析(3)-質問・回答履歴を用いたベストアンサー推定-
- Q&Aサイトにおける質問と回答の分析(2)-文の構造と属性を中心に-
- D-027 特許の無効資料調査のための類似特許検索とリランキング(データベース,一般論文)
- 6X-4 SVMを用いた記憶想起時の脳波からの認知状態判別(音声・言語処理,学生セッション,人工知能と認知科学)
- 5U-6 質疑応答関係に着目した議論の構造の抽出(情報抽出,学生セッション,人工知能と認知科学)
- 5U-5 Webニュース記事視覚化のための情報抽出 : 地名と地名参照情報との関連付け(情報抽出,学生セッション,人工知能と認知科学)
- 5T-1 階層型自己組織化マップを用いた検索結果の可視化システム(メディア情報可視化,学生セッション,データベースとメディア)
- 6R-6 動画サイトのコメントを利用した動画シーン検索(マルチメディア処理,学生セッション,データベースとメディア)
- E-040 映画のブログからの意見情報抽出に基づく関心の分析(E分野:自然言語・音声・音楽)
- RD-003 コミュニティQAにおける良質な回答の選定タスク : 評価方法に関する考察(D分野:データベース,査読付き論文)
- 5J-6 キーワードのバースト特性を利用したスパムブログデータセットの作成と分析(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Wikipedia を介した関連ニュース・ブログの対応付け : Wikipedia エントリの分析
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Q&Aサイトにおけるベストアンサー推定可能性の検証
- Web 上の exploratory search の特徴 : 発話プロトコルと事後インタビュー分析結果より
- Link Depth : Web情報探索行動の閲覧パターンの分析
- Link Depth : Web情報探索行動の閲覧パターンの分析
- Q&Aサイトにおける質問と回答の分析(3) : 質問・回答履歴を用いたベストアンサー推定
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- Q&Aサイトにおける質問と回答の分析(3) : 質問・回答履歴を用いたベストアンサー推定
- 新聞記事とコミュニティQAを対象とした詳細な意見分析コーパスの作成と分析
- 評価ワークショップによるテキスト処理研究 : 第3回NTCIRワークショップを例として(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- 情報アクセス技術の性能評価のための研究基盤NTCIR : 言語横断検索の創成と展開(NTCIR特別セッション)
- 情報アクセス技術の性能評価のための研究基盤NTCIR : 言語横断検索の創成と展開(NTCIR特別セッション)
- NTCIR-3 言語横断検索タスクの分析 : プーリングを中心として
- 大規模テストコレクション構築のためのプーリング : NTCIR-3言語横断検索タスクの分析
- 情報アクセス対話に向けた質問応答技術の評価ふたたび : NTCIR-5 QAC3での試み(文書処理,質問応答)
- リスト型質問応答の特徴付けと評価指標(質問応答)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- リスト型質問応答の特徴付けと評価指標(質問応答)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 質問応答技術は情報アクセス対話を実現できるか(質問応答)
- 情報検索と要約の評価 : 第2回NTCIRワークショップ概要
- 意見文に関する情報付与と意見に焦点を当てた要約の関係の分析(要約)
- 意見文に関する情報付与と意見に焦点を当てた要約の関係の分析(要約)
- 利用者の情報要求を考慮した観点に基づく複数文書要約とその評価
- 感情表現の抽出手法に関する提案(表理解,アライメント,抽出)
- 感情表現の抽出手法に関する提案(表理解,アライメント,抽出)
- 事実・意見・知識に焦点を当てた観点に基づく複数文書要約(複数文書の処理)
- NTCIR-3 WEB : Web 検索のための評価ワークショップ(電子文書処理)
- 検索課題の難易度を考慮したテキスト検索システムの評価(情報の検索とテストコレクション)
- Web検索チャレンジの課題 : NTCIRワークショップ3の新タスク
- テストコレクションにおける検索課題の難易度予測への挑戦
- 3V-3 LDAによる国会会議録を対象にしたセグメンテーションの一手法(文章・感情,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- タスク種別とユーザ特性の違いが Web 情報探索行動に与える影響 : 眼球運動データおよび閲覧行動ログを用いた分析
- 意見分析タスク : 多言語テキストを対象とした意見抽出技術の評価(NTCIR特別セッション)
- 意見分析タスク : 多言語テキストを対象とした意見抽出技術の評価(NTCIR特別セッション)
- Q&Aサイトにおける質問と回答の分析
- Q&Aサイトにおける質問と回答の分析
- コミュニティQAにおける質問の多面的評価法の検討
- 複数国の新聞サイトを比較分析するNSContrastの実験的分析
- 複数国の新聞サイトを比較分析するNSContrastの実験的分析
- 日本語と英語の文タイプの自動付与とその特徴素(一般セッション, ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- 日本語と英語の文タイプの自動付与とその特徴素(一般セッション, ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- 2C-4 文書ジャンルを横断した回答意見の検索のための分析(情報抽出,一般セッション,データベースとメディア,情報処理学会創立50周年記念)