文脈情報を使用した略語の自動復元

スポンサーリンク

概要

論文の詳細を見る
テキスト処理において、固有名詞、略語、頭字語などの未知語の処理は難しい問題である。未知語は、情報検索、テキストデータマイニングなどの応用システムや人間の理解に悪影響を与える。特に特定の対象領域に関するテキストでは略語は多用される.本論文では、略語の自動復元について述べる。従来の研究では、略語の復元の為の候補語の選定に辞書を使用していたが、本論文では、同じメインのテキストで略語をできるだけ含まないようなものを知識源として使用する。候補語の中から正しい復元形を見つけるために、復元対象となる略語の文脈情報と知識源に含まれる復元形の候補語の文脈情報の類似性を使用した。文脈情報とは、語の前後に出現する単語を意味する。ベクトル空間法において、略語および候補語の近似度を文脈情報により計算し、候補語の中から正しい復元形を選定した。航空関係の10, 000文書を対象に実験をおこなったところ従来法に比較して精度で約10%の改善を得た.
一般社団法人情報処理学会の論文
2001-07-16

著者

関連論文

もっと見る

スポンサーリンク