統計によるタグ付きコーパスからの統語規則の獲得

スポンサーリンク

概要

論文の詳細を見る
本論文では、自然言語を文脈自由文法でモデル化し、タグ付コーパスから文法を獲得する方法を提案し、この手法による統語規則の獲得の実験結果を評価する。我々が提案する手法は以下の3つの仮定に基づいている。1)統語規則の右辺に現れる記号列は環境から独立して高い頻度で現れる。2)同じ非終端記号から直接導出される品詞列は類似した環境を持つ。3)コーパスの大きさを最も減少させる統語規則が適切である。これらの仮定に基づいてひとまとまりとなる品詞列を見つけ、これを新たな記号で置き換える。これを繰り返すことによって、統語規則の集合(文法)と統語構造を与えられたコーパスが得られる。
一般社団法人情報処理学会の論文
1995-11-17

著者

関連論文

もっと見る

スポンサーリンク