情報の信頼性分析に向けた評価データおよびプロトタイプシステムWISDOM
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,情報の信頼性を自然言語処理に基づいて分析する際に必要となる評価用データおよびプロトタイプシステムWISDOMについて述べる.われわれは,ウェブ上のテキストを主な対象として,情報信頼性を分析することを目指したプロジェクトを2006年4月より進めている.本プロジェクトでは,ウェブ上の情報の信頼性を,情報内容,情報発信者,情報外観,社会的評価といった4つの基準で捉えることを提案しており,これらを述語項構造を単位とする自然言語処理によって論理的に分析・組織化することを目指している.本稿で述べる評価用データは,これら種々の分析処理の学習・検証用データとして構築されたものであり,時事問題,医療問題等の20トピックを選定し,各100ウェブページを収集して,各評価尺度のデータを人手で付与したものである.また,情報信頼性を多角的に評価するプロトタイプシステムWISDOMを開発した.本システムを用いて上記評価尺度で条件を様々に変化させて情報閲覧することにより,興味のトピックについて,信頼できる情報をより確実に見極めることができるようになる.
- 一般社団法人情報処理学会の論文
- 2007-07-24
著者
-
加藤 義清
情報通信研究機構
-
乾 健太郎
情報通信研究機構
-
黒橋 禎夫
情報通信研究機構
-
加藤 義清
宇宙航空研究開発機構 総合技術研究本部
-
乾 健太郎
奈良先端科学技術大学院大学
-
宮森 恒
情報通信研究機構
-
乾 健太郎
東北大学大学院情報科学研究科:奈良先端科学技術大学院大学情報科学研究科
-
加藤 義清
(独)情報通信研究機構
-
角 薫
情報通信研究機構
-
角 薫
情報通信研究機構知識処理グループ
-
兼岩 憲
情報通信研究機構知識創成コミュニケーション研究センター
-
宮森 恒
情報通信研究機構知識処理グループ
-
赤峯 享
情報通信研究機構知識処理グループ
-
乾 健太郎
情報通信研究機構|東北大学大学院情報科学研究科
-
兼岩 憲
情報通信研究機構
-
兼岩 憲
情報通信研究機構知識処理グループ
-
赤峯 享
情報通信研究機構
関連論文
- Webページの情報発信者の同定
- テキスト情報分析のための判断情報アノテーション(自然言語処理,意味解析,情報爆発論文)
- 主要・対立表現の俯瞰的把握 : ウェブの情報信頼性分析に向けて(情報分析・要約(テーマセッション1))
- 相互運用性を指向した機能・不具合知識の統合とその概念写像に基づく知識変換
- 依存関係確率モデルを用いた統計的句アライメント
- 大規模テキストコーパスからの知識獲得
- 情報爆発時代における情報管理・融合・活用基盤(情報爆発時代に向けた新しいIT基盤技術の研究)
- 複数文書から抽出した言明間の意味的関係の整理と関係付与(コーパス)
- 言語情報編集のための広義モダリティ解析に向けて (産業日本語関連)
- 事象間関係知識の整備と類似・対立認識への応用(単語・事象・オントロジー)
- E-053 言論マップ生成のための事象間類似・対立関係の認識(自然言語・音声・音楽,一般論文)
- E-052 テキスト情報の事実性解析(自然言語・音声・音楽,一般論文)
- E-040 含意・矛盾認識のための事象間関係知識の整備(自然言語・音声・音楽,一般論文)
- 言論マップ生成課題 : 言説間の類似・対立の構造を捉えるために(情報分析・要約(テーマセッション1))
- 表層・語彙的特徴量に基づくブログの面白さ分析(学生セッション I)
- 言語情報と映像情報の統合による物体のモデル学習と認識(自然言語,新しいパラダイムの中での分散システム/インターネット運用・管理)
- 4J-3 経験マイニングのための事実性解析(情報爆発時代におけるデータマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 事態抽出のための事実性解析(Web情報アクセス)
- 翻訳用例の柔軟な結合に関する考察 (機械翻訳技術の向上)
- 大規模問題における問題構造に応じた知識の収集
- 競合事物間における比較関係認識
- 競合事物間における比較関係認識
- 自動通訳に向けた用語自動収集(翻訳,対話)
- 小規模タグ付きコーパスと自動獲得した大規模語彙知識を用いた識別モデルに基づくゼロ照応解析
- 文間の弱い対立関係の認識
- 文脈に依存した述語の同義関係獲得
- 時間属性付き文書集合からの潜在多重文脈の抽出 (特集 「人と技術とAI」および一般)
- 語の出現依存度に基づくメールからの設計意図抽出 (テーマ:特集「シンボルグラウンディング問題」および一般)
- 1.キーワードサーチを超える情報爆発サーチ : 自然言語処理で価値ある未知をマイニング(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 日本語文章の事象に対する判断情報アノテーション
- 言論マップ生成課題 : 言説間の類似・対立の構造を捉えるために(情報分析・要約(テーマセッション1))
- 用例ベース翻訳の確率的モデル化
- 機械翻訳最新事情 : (下)評価型ワークショップの動向と日本からの貢献
- 帰属文書数に基づく Web ページ情報発信者の専門性分析
- 帰属文書数に基づくWebページ情報発信者の専門性分析
- 帰属文書数に基づくWebページ情報発信者の専門性分析
- 文間関係認識のための局所構造アライメント
- 文間関係認識のための局所構造アライメント
- 文間関係認識のための局所構造アライメント
- 共起パターンの学習による事態間関係知識の獲得
- メッセージの背後に潜む「問い」の抽出
- 多言語コミュニティヘの用例ベース翻訳の適用(言語グリッドと異文化コラボレーション)
- 情報の信頼性分析に向けた評価データおよびプロトタイプシステムWISDOM
- 情報の信頼性分析に向けた評価データおよびプロトタイプシステムWISDOM(QA・Web検索)
- Webから獲得した感情生起要因コーパスに基づく感情推定
- 事例の重み付けに基づく自動獲得されたコーパスの効果的な利用法と評価極性分類への応用(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 隠れ変数を持つ条件付き確率場による依存構造木の評価極性分類 (言語理解とコミュニケーション)
- 雑談対話のための評価表現を利用する相槌
- ウェブニュースを利用した雑談対話システム
- 結束性と首尾一貫性から見たゼロ照応解析(解析・抽出)
- Happy Academic Life 2006:研究者の人生ゲーム : ゲーム型キャリアデザイン学習教材の開発(人工知能学会創設20周年記念企画)
- 研究の状態表現(20周年記念事業の進捗報告)
- ゲームで学ぶ研究者のキャリアデザイン(連載: 20周年記念事業の進捗報告)
- 表層的語彙分布に基づく談話/テクストの主観性・主体性分析に向けて
- WWWからの知識獲得--自然言語処理における新展開 (特集 WWWを対象にした日本語研究)
- Webページの大規模収集・検索基盤の構築と運用
- Webページの大規模収集・検索基盤の構築と運用
- 隠れ変数を持つ条件付き確率場による依存構造木の評価極性分類
- E-001 Web文書からの主観的・客観的評価表現の抽出(自然言語・音声・音楽,一般論文)
- D-036 Web情報信頼性分析のためのページ外観情報の抽出(データベース,一般論文)
- D-035 Webページの著者の同定(データベース,一般論文)
- 宇宙機の設計・運用へのオントロジー工学の適用に関する研究
- 事態抽出のための事実性解析(Web情報アクセス)
- RE-002 二段階の機械学習を用いたボトムアップ型の固有表現認識(自然言語・音声・音楽,査読付き論文)
- 言語の理解へ
- キーワード蒸留型クラスタリングによる大規模ウェブ情報の俯瞰
- クエリの語句の重要度と係り受けを考慮した自然文検索(検索・対話)
- クエリの語句の重要度と係り受けを考慮した自然文検索(検索・対話)
- 依存関係確率モデルを用いた統計的句アライメント (機械翻訳技術の向上)
- 1X-8 日本語文章における直接照応および間接照応の統合的解析(意味・談話解析,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 論争の枠組みに基づく設計意図表現 (テーマ:特集 「感性とインタラクション」および一般)
- 衛星開発における失敗防止のための電子メール処理システム (ことば工学研究会(第10回)テーマ:やはり、ことばって何?)
- 大域的情報を用いた日本語固有表現認識
- 主要・対立表現の俯瞰的把握 : ウェブの情報信頼性分析に向けて(情報分析・要約(テーマセッション1))
- 検索エンジン基盤TSUBAKIを用いた大規模ウェブ情報クラスタリングシステムの構築(Web情報アクセス)
- 検索エンジン基盤TSUBAKIを用いた大規模ウェブ情報クラスタリングシステムの構築(Web情報アクセス)
- 議論スキームに基づく設計における意思決定のモデル化の検討 (特集 「大規模データからの機械学習と自然言語処理への応用」および一般)
- 人工知能学会第20回全国大会Happy Academic Life 2006ゲーム大会報告
- 宇宙開発における人間-機械系 : 知的支援技術と知識マネジメント(「宇宙開発とAI」)
- A System for Enabling Evolutionary Knowledge Management Process across the Life Cycle of Complex Engineering Systems(Inflastructure of Knowledge/Information)(Doctorial Theses on Aritifical Intelligence)
- 自動構築した大規模格フレームに基づく構文・格解析の統合的確率モデル
- 格フレームを用いた自然言語処理(下)格フレームに基づく構文・格解析とその応用
- 格フレームを用いた自然言語処理(上)基本語彙の整理と格フレームの自動獲得
- 高性能計算環境を用いたWebからの大規模格フレーム構築
- 名詞格フレーム辞書の自動構築とそれを用いた名詞句の関係解析
- 格フレーム辞書の漸次的自動構築
- 表層・語彙的特徴量に基づくブログの面白さ分析(学生セッション I)
- 自動獲得した名詞関係辞書に基づく共参照解析の高度化
- 述語項構造と照応関係のアノテーション : NAISTテキストコーパス構築の経験から
- 名詞句の語彙統語パターンを用いた事態性名詞の項構造解析
- 項の共有関係と統語パターンを用いた事態間関係獲得
- 会話コンテンツ獲得と管理(会話情報学)
- 問題を語る
- 論駁推論による計算可能な設計意図表現の検討 (特集 オントロジー)
- 2種類のアンカー情報と共起パターンの組み合わせによる事態間関係獲得(語彙知識)
- 2種類のアンカー情報と共起パターンの組み合わせによる事態間関係獲得(語彙知識)
- 言語情報間の含意・矛盾関係の認識 (特集 言語処理研究の新展開--計算機と言語学の対話に向けて)
- 文間関係認識に基づく賛成・反対意見の俯瞰
- 自然言語処理と言い換え (特集 言葉を言い換える)
- 1104 議論に基づく設計意図表現に向けた人工衛星設計の事例分析(OS10-1 設計における知識マネジメント・情報共有I,OS10 設計における知識マネジメント・情報共有)