接続標識に基づく文書集合からの因果関係知識獲得(知識情報インフラ)(<特集>人工知能分野における博士論文)
スポンサーリンク
概要
- 論文の詳細を見る
A major challenge in natural language understanding is to build a comprehensive common-sense knowledge base in the efficient way possible This thesis discusses automatic knowledge acqursition from text, especrally the acquisition of causal relations We consider four types of causal relations, namely, cause, effect, precondition and means They are based on agents' volitionality, as proposed in discourse understanding The idea behind knowledge acquisition is to use resultative connective markers such as "because", "but" and "if" as linguistic cues However, there is no guarantee that such a connective marker always signals the same type of causal relation Therefore, we need to create a computational model that is able to classify samples according to the causal relation. In this work, we focus on Japanese complex sentences including the word ため(because) The following questions are asked (1) What kinds and how much causal knowledge is present in the document collection, (2) How accurately can relation instances be identified, and (3) How can acquired causal knowledge be made available to applications First, we investigated the distribution of causal relation instances in Japanese newspaper articles The main part of this investigation was conducted based on human judgments using lingnstic tests. We confirmed that it is possible to acquire causal relation instances from approximately 90 % of samples Second, we assessed how accurately we can automatically acquire causal relation instances by experiments Using a machine learning technique, we achieved 80 % recall with over 95 % precision for the cause, precondition and means relations, and 30 % recall with 90 % precision for the effect relation Furthermore, the classification results suggest that one can expect to acquire over 27,000 instances of causal relations from one year of Japanese newspaper articles Third, we applied the acquired causal knowledge to annotate words with its desirability From this investigation, it became clear that causal relation instances, at least instances of cause relations and means relations, are useful for assigning desirability of words
- 社団法人人工知能学会の論文
- 2005-01-01
著者
関連論文
- 社会課題とその解決に結びつく科学技術に関する有用知識の抽出
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- スピンモデルによる単語の感情極性抽出(自然言語)
- 拡張固有表現タグ付きコーパスの構築(マイニング・知識獲得・固有表現)
- イベントの生起時間帯判定(分類, ブログ)
- 1.テキスト評価分析の技術とその応用(ユーザ作成のコンテンツに着目した嗜好・評判抽出, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
- 社会課題発見のための文書クラスタリングとクラスタ評価指標
- 接尾辞情報を利用した文書からの組織名抽出
- E-014 新聞記事からの社会課題に対する技術的対策情報の抽出(自然言語・音声・音楽,一般論文)
- テキスト中のイベントの生起時間帯判定(自然言語)
- 専門用語抽出における助詞情報の利用に関する一考察(情報抽出・ラベル付与)
- キーワード抽出の整数計画問題としての定式化(機械学習・応用)
- 社会課題発見のための文書クラスタリングとクラスタ評価指標(情報分析・要約(テーマセッション1))
- 文書クラスタリングによるトピック抽出および課題発見
- 文書からの組織名抽出における辞書利用(情報抽出・ラベル付与)
- 2E07 大規模テキストマイニングによる医療分野の社会課題・技術トレンド抽出(メトリクス,一般講演,第22回年次学術大会)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 共起語に基づいた階層型文書クラスタリング手法(セッション1:テキストマイニング)
- 隠れ変数モデルによる複数語表現の感情極性分類(自然言語)
- テキストを対象とした評価情報の分析に関する研究動向
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 極性反転に対応した評価表現モデル(言語の統計モデル)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- 文書内に現れる因果関係の出現特性調査(解析, QA, 言語調査)
- スピンモデルによる単語の感情極性判定(シソーラス・辞書)
- 文書内に現れる因果関係の出現特性調査
- 接続標識「ため」に基づく文書集合からの因果関係知識の自動獲得(自然言語)
- 接続助詞「ため」を含む複文から因果関係知識を獲得する
- 接続助詞「ため」を含む複文から因果関係知識を獲得する
- 複数のパーザを利用した統計的部分係り受け解析
- 語釈文を利用した「p/n 辞書」の作成 (テーマ なぜインタラクションでなければならないか?)
- 統計的部分係り受け解析における係り受け確率の利用法 : コーパス中の構文タグ誤りの検出
- 接続標識に基づく文書集合からの因果関係知識獲得(知識情報インフラ)(人工知能分野における博士論文)
- 評価表現と文脈一貫性を利用した教師データ自動獲得によるクレーム文検知 (言語理解とコミュニケーション)
- 評価表現と文脈一貫性を利用した教師データ自動獲得によるクレーム文検知(第3回集合知シンポジウム)
- E-034 レビュー集合要約における特徴的評価視点セレクション(感情・評判,E分野:自然言語・音声・音楽)
- ブログページ集合からのポストおよびコメント自動分離抽出手法