排反な規則を用いた文節まとめあげ
スポンサーリンク
概要
- 論文の詳細を見る
本論文では文節のまとめあげを研究の対象とする.文節まとめあげの処理は,係り受け文法に基づく日本語文の構文解析の際に必要となるものである.本研究ではこの文節まとめあげを対象として,既存の4手法(決定木学習,最大エントロピー法,用例ベースの手法,決定リストの手法)と,類似度の大きい排反な規則を用いる新手法の比較実験を行った.その結果,今回の問題設定では類似度の大きい排反な規則を用いる提案手法が最も良いことが分かった.排反な規則とは学習データにおいて分類先が排他的になっており,学習データにおいては100%正しく推定できる規則になっていることを意味する.従来の機械学習のほとんどは排反でない規則,つまり,学習データでの精度が100%でない規則を用いて解いているものであったが,これはあらかじめ間違う可能性がある規則を用いて解いているということを意味している.今後より高い精度の解析を目指すならば提案手法のような排反な規則を利用して解析するという考え方をとる必要がある.しかし,単純に排反な規則を用いるだけでは偶然その学習データでは排反な規則になったという無意味な規則まで用いてしまうことになる.本論文で提案する類似度と排反な規則を用いる提案手法は,排反な規則の中でも入カとの類似度の高いものだけを用いることで,無意味な排反な規則を用いてしまう弊害を解決している.つまり,提案手法は類似度の高い信頼できる排反な規則だけを用いることとなり,類似度の低い信頼性の低い(無意味な)排反な規則を捨てていることとなるのである.提案手法は,類似度を適切に定義できる問題ではきわめて有力な手法となっている.
- 一般社団法人情報処理学会の論文
- 2000-01-15
著者
関連論文
- 音声言語関連大型プロジェクトの現状と将来
- 日本語発話文の敬語の誤用を指摘するシステム(人工知能)
- 語音弁別の神経機構 : 失語症患者の研究から得られたもの
- 失語症例の音の分離能力(クリック音融合閾)と聴覚的言語理解の関係について
- 日本人英語における実践的コミュニケーション能力の発達段階の分析 : 誤りが通じやすさに及ぼす影響を指標として(言語と学習)
- 言語資源の用途情報の抽出と利用(情報抽出・評判分析)
- 日本語文生成における語彙選択に必要な要因とその性質
- 開発者の視点からの機械翻訳システムの技術的評価 : テストセットを用いた晶質評価法
- 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
- 日英単言語Webコーパスからの対訳treebank自動獲得 (言語理解とコミュニケーション)