日本語語彙大系を用いたWikipediaからの汎用オントロジー構築
スポンサーリンク
概要
- 論文の詳細を見る
日本語語彙大系を上位階層として,日本語 Wikipedia から is-a 関係のオントロジーを半自動で構築する手法を提案する.はじめに,語彙大系の末端の意味属性に,分類基準が同じ Wikipedia のカテゴリを半自動で対応づける.次に,対応づけされた Wikipedia のカテゴリより下位のカテゴリから,語彙大系の知識を利用して自動で is-a 関係の階層構造を構築する.最後に,カテゴリに所属する記事の見出し語をインスタンスとして抽出する.構築した is-a 関係の階層構造からカテゴリを取り出し,その親カテゴリとの is-a 関係が成り立つかどうか,また先祖のカテゴリ全てで is-a 関係が成り立つかどうかをサンプル調査した.その結果,適合率はそれぞれ 92.8%,82.6% であった.また,インスタンスの適合率は 98.6% であった.Wikipedia のカテゴリ 49,543 件のうち 23,289 件 (47%),記事の見出し語 479,231 件のうち 263,631 件 (55%) をオントロジー化することに成功した.本手法により,Wikipedia から高精度で大規模な is-a 関係の汎用オントロジーを構築することができた.
- 2009-11-09
著者
-
山本 和英
Atr音声言語コミュニケーション研究所
-
山本 和英
長岡技術科学大学 電気系
-
山本 和英
Atr音声翻訳通信研究所:(現)atr音声言語通信研究所
-
永田 昌明
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
柴木 優美
長岡技術科学大学電気系
-
永田 昌明
NTTコミュニケーション科学基礎研究所
-
山本 和英
良岡技術科学大学 電気系
関連論文
- Webコーパスの提案(コーパス構築)(セマンティックウェブと自然言語処理その他一般)
- ラベルありデータの選択バイアスに頑健な半教師あり学習
- 同義語情報を用いた確率的単語アライメントモデル
- Wikipediaからの大規模な人オントロジー構築
- 日本語用言を見つめ直す
- 対訳辞書作成のための英訳辞書の照合
- 対訳辞書作成のための英訳辞書の照合
- 計算機処理のための韓国語言語体系と形態素処理
- 日本語語彙大系を用いたWikipediaからの汎用オントロジー構築
- 機械翻訳最新事情 : (下)評価型ワークショップの動向と日本からの貢献