組織情報を用いた人名の暖昧性解消方式(形態素・固有表現)
スポンサーリンク
概要
- 論文の詳細を見る
人名文字列とそれに対応する実体としての「人」には同姓同名による曖昧性がある。本研究ではまず,テキストに出現する人名の曖昧性ついて営業日報データ7,600件を対象に調査を行った。その結果,営業日報データには延べ5,778件の人名が出現しており,そのうち55%に同姓同名による曖昧性が存在し,文字列だけで「人」を同定すると最大52人の「人」を同一人物としてしまう可能性があることが分かった。これに対して,本研究では人名と同じ文に出現する組織名を利用した曖昧性解消アルゴリズムを提案する。先の営業日報データを用いた実験では,曖昧性のある人名に対して89%の精度で正しく「人」に同定できるという結果を得た。
- 社団法人電子情報通信学会の論文
- 2006-07-20
著者
関連論文
- 情報のメタデータに着目した情報ライフサイクル管理向けポリシー記述方式
- 情報ライフサイクル管理のためのポリシー記述方式とその解釈実行方式
- 共起語集合の類似度に基づく対訳コーパスからの対訳語抽出
- 慣用句抽出のための統計尺度の比較評価(語彙的知識獲得)
- テキストコーパスからのトピック階層の抽出(自然言語)(コラボレーションアートとネットワークエンターテイメント)
- 組織情報を用いた人名の暖昧性解消方式(形態素・固有表現)
- 組織情報を用いた人名の暖昧性解消方式(形態素・固有表現)
- E-034 決定木の逐次学習による固有表現抽出(E.自然言語・文書・ゲーム)
- 交通ICカード利用履歴を用いた生活行動属性指標の提案(行動解析,ユーザ属性情報,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,一般)