Wikipediaカテゴリ階層構造の固有名詞分類実験における効果(語彙・知識獲得)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,Wikipediaの記事タイトルを機械学習手法を用いて固有名詞クラスへと分類する際にWikipediaのカテゴリ階層を分類器の素性として用いた場合の効果について報告する.ある記事タイトルに関連するWikipediaのカテゴリネットワーク情報を分類器の素性として用いるために,あるカテゴリのカテゴリ階層構造をシンプルな基準「主要カテゴリからの最短経路」によってWikipediaのカテゴリネットワークから抽出した.Wikipediaの語を関根の拡張固有名詞階層へ機械学習手法を用いて分類する実験において,得られたカテゴリ階層構造の効果を確認した.固有名詞クラスの粒度は荒いクラス分類(固有名詞階層の深さ2)と細かいクラス分類(固有名詞階層の深さ4)の2種類を用意し,荒い固有名詞分類においては7クラスおよび15クラスへと分類する実験,細かい固有名詞分類においては118クラスへと分類する実験を行った,カテゴリ階層構造を用いない場合と比較して,カテゴリ階層構造を用いた場合に,より良いF値が得られた.最良の分類器による精度はそれぞれF値91.33,F値89.68,F値84.06であった.また,カテゴリ階層構造はRecallの向上に特に効果的であり,その効果は分類先の固有名詞分類の粒度が細かくなれば減少することが分かった.
- 2009-01-15
著者
-
梅基 宏
富士ゼロックス(株)研究技術開発本部システム要素技術研究所
-
増市 博
富士ゼロックス(株)研究技術開発本部システム要素技術研究所
-
増市 博
富士ゼロックス (株) 中央研究所
-
増市 博
富士ゼロックス(株)
-
杉原 大悟
富士ゼロックス株式会社研究技術開発本部
-
鷹合 基行
富士ゼロックス株式会社研究技術開発本部
関連論文
- 日本語LFGにもとづく助数詞の処理
- Wikipediaカテゴリ階層構造の固有名詞分類実験における効果(語彙・知識獲得)
- デ-05 読影レポート作成に対する入力補完技術の提案とその有効性の検証(デモセッション,インタフェース)
- Wikipediaカテゴリ階層構造の固有名詞分類実験における効果(語彙・知識獲得)
- 部分文字列のパープレキシティを利用した低頻度専門用語抽出
- 部分文字列のパープレキシティを利用した低頻度専門用語抽出(用語・情報抽出)
- 臨床テキストに対する医学オントロジーに基づくアノテーション手法に関する研究(言語理解とオントロジーシンポジウム)
- Lexical Functional Grammarに基づく言語解析の現状とその応用(深い言語処理のためのフレームワーク)
- Amazonレビュー文の有用性判別実験(解析,分析)
- 日本語LFGを用いた副助詞の多義性解消
- 生成のための日本語LFG文法の構築
- 語彙的連鎖からの名詞照応連鎖の抽出(抽出(2))
- 語彙的連鎖からの名詞照応連鎖の抽出(抽出(2))
- 文法記述に基づく言語解析の進展と多言語処理の可能性
- Support Vector Machineに基づくf-structureの選択(構文,係り受け解析)
- Support Vector Machine に基づくf-structureの選択(構文, 係り受け解析)(言語理解とコミュニケーション)
- Support Vector Machine に基づく f-structure の選択
- 日本語LFGパーザによる助詞・助動詞の無形表示の統語意味解析
- 日本語LFGパーザによる助詞・助動詞の無形表示の統語意味解析
- LFG解析と語彙資源を利用した日本語含意関係判定(含意関係認識・解析・語彙)
- デ-10 読影レポートを対象とした予測入力システム(デモセッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 語彙機能文法に対するGlue意味論に基づいた日本語解析器の実装(深い言語処理のためのフレームワーク)
- 問題解決のための階層型自律分散システムの構成
- Lexical Functional Grammar に基づく実用的な日本語解析システムの構築
- 対話型ソフトウェア構築のためのマルチエージェント
- 形態素解析を用いた全文検索システムとその応用
- 2U-6 関連文書検索システムの開発(4) : 関連文書検索
- 2U-5 関連文書検索システムの開発(3) : 複合語辞書
- 2U-4 関連文書検索システムの開発(2) : 構造化文書の処理
- 2U-3 関連文書検索システムの開発(1) : 全体構成
- GuardNet:マルチエージェント系のコミュニケーション機構の分散開発・実行環境
- LFG理論をめぐる言語処理研究の発展(ポスト経験主義の言語処理)
- 営業支援システム内に蓄積されたテキストデータからの課題記述文抽出 (言語理解とコミュニケーション)
- LFG理論をめぐる言語処理研究の発展
- 営業支援システム内に蓄積されたテキストデータからの課題記述文抽出(抽出,第2回テキストマイニング・シンポジウム)