コーパスを利用した分類語彙表の未登録語義の発見

スポンサーリンク

概要

論文の詳細を見る
本論文では, 分類語彙表に未登録の語義を, コーパスを利用することで発見する手法を提案する. 本手法は, まず慣用表現中の語義の特異性を利用してコーパスから慣用表現を抽出する. その誤抽出から分類語彙表に未登録の語義を持つ名詞を推定し, その未登録の語義と類似の語義を持つ名詞を例示する. 最終的な未登録語義の決定はこれらの名詞を利用して手作業により行う. 本手法は分類語彙表中の不適切な語義, あるいは利用したコーパスの分野に固有の語義などの発見も可能である. 日経新聞記事5年分を利用した実験では, 177種の未登録語義を発見できた.
1997-05-15

著者

新納浩幸
茨城大学工学部情報工学科

関連論文

もっと見る

スポンサーリンク