完全N部グラフ構造を用いた単語の多義性獲得(<特集>「自動推論:帰納,演繹,モデル検査/生成,学習,発見,仮説推論,論理プログラム,プランニングetc.」及び一般)(一般及び自動推論)

スポンサーリンク

概要

論文の詳細を見る
本論文ではテキスコーパスを解析して,この中に含まれる多義性を持つ単語を発見するための方法を提案する.この方法ではまずコーパス中に含まれる単語同士の関係を形態素解析などによって抽出しておき,この関係の集合からN部グラフを構成する.次にこのグラフ中に含まれる極大完全N部グラフを抽出し,ある単語が複数の分類(語義に対応する)に属することを許容するようなクラスタリングを行う.これにより多義性を持つ単語であれば複数のクラスタに含まれるようになるため,その所属するクラスタの数に注目することで多義性を獲得可能になる.この効果を確認するために行った実験では,約30万の用例からグラフを構成し,約3万の単語を対象にクラスタリングを行った結果531の候補を得た.そのうち20語が実際に多義語であった.
2003-05-22

著者

関連論文

もっと見る

スポンサーリンク