HTML文書からの単語間の上位下位関係の自動獲得(獲得,辞書)

スポンサーリンク

概要

論文の詳細を見る
本稿では,単語の上位下位関係をWWW上のドキュメントより自動獲得する手法を提案する.従来より,単語の上位下位関係は自然言語処理において重要な知識であると見なされており,多くの自動獲得手法が提案されてきた.それらの多くは,名詞句の併置などの文の表層のパターンに注目するものがほとんどであった.本稿で提案する手法は,これらと異なるアプローチをとる.より具体的には,1)Web上にあるHTMLタグの繰り返し,2)従来情報検索などで使われてきたDF, IDFなどの統計量,3)名詞が持つ主として動詞との係り受け関係の三種の情報を組み合わせることで,単語の上位下位関係を自動的に獲得することを目指す.
一般社団法人情報処理学会の論文
2003-11-06

著者

関連論文

もっと見る

スポンサーリンク