文脈情報を使用した略語の自動復元
スポンサーリンク
概要
- 論文の詳細を見る
テキスト処理において、固有名詞、略語、頭字語などの未知語の処理は難しい問題である。未知語は、情報検索、テキストデータマイニングなどの応用システムや人間の理解に悪影響を与える。特に特定の対象領域に関するテキストでは略語は多用される.本論文では、略語の自動復元について述べる。従来の研究では、略語の復元の為の候補語の選定に辞書を使用していたが、本論文では、同じメインのテキストで略語をできるだけ含まないようなものを知識源として使用する。候補語の中から正しい復元形を見つけるために、復元対象となる略語の文脈情報と知識源に含まれる復元形の候補語の文脈情報の類似性を使用した。文脈情報とは、語の前後に出現する単語を意味する。ベクトル空間法において、略語および候補語の近似度を文脈情報により計算し、候補語の中から正しい復元形を選定した。航空関係の10, 000文書を対象に実験をおこなったところ従来法に比較して精度で約10%の改善を得た.
- 一般社団法人情報処理学会の論文
- 2001-07-16
著者
関連論文
- 大域的な文章構造の類似性を利用したクローズドキャプション中の定型的な文章区間の抽出(自然言語処理)
- 格フレーム辞書を用いた日本語複合名詞の解析(学生セッション II)
- TREC-7参加報告
- 放送番組を素材としたマルチメディア百科事典の自動構築
- 岩波国語辞典を利用した語義タグ付きテキストデータベースの作成
- 格フレーム辞書を用いた日本語複合名詞の解析(学生セッション II)
- 日本語空間名詞の分類(特別セッション「言語理解と行動」(3))
- 日本語空間名詞の分類(特別セッション : 言語理解と行動(3))
- F-014 エージェントのための空間名詞の分類とその解釈方法について(F.人工知能)
- D-5-10 視界からの情報を用いた空間表現の理解に関する研究(D-5. 言語理解とコミュニケーション)