カテゴリ階層を考慮した構造化パーセプトロンによる固有表現抽出
スポンサーリンク
概要
- 論文の詳細を見る
固有表現抽出は,テキスト中に現れる人名などの語句の同定を目的とする自然言語処理の基本的な問題である.抽出する固有表現は,人名や組織名など数種類を対象とすることが一般的であり,これらのカテゴリの間の関係は考慮しないことが多い.しかし,これらのカテゴリは階層性を有する場合があり,その場合,階層的に近い(遠い)という情報は抽出の際に活用できる可能性がある.本研究では,階層構造が定義された固有表現を対象に,階層的な近さの値を与えるコスト関数を定義する.機械学習手法である構造化パーセプトロンにコスト関数を導入し,カテゴリの階層性を考慮した固有表現抽出法を提案する.GENIAコーパスを用いて階層構造を持つ固有表現の抽出実験を行い,提案手法により,抽出の誤りの程度を小さくするとともに,正しい固有表現の抽出精度を高めることが可能になることを示す.
- 2013-12-27
著者
-
関 和広
神戸大学自然科学系先端融合研究環
-
上原 邦昭
神戸大学大学院システム情報学研究科
-
関 和広
神戸大学大学院システム情報学研究科
-
ブロンデル マチュー
神戸大学大学院システム情報学研究科
-
東山 翔平
神戸大学大学院システム情報学研究科
-
ブロンデル マチュー
神戸大学大学院システム情報学研究科|現在,NTTコミュニケーション科学基礎研究所
関連論文
- 実空間検索メタデータとしてのソーシャルメディア (ライフインテリジェンスとオフィス情報システム)
- 原言語音韻を考慮した多様なカタカナ異表記生成モデル
- 英音素変換を用いたカタカナ異表記の自動生成(機械翻訳・医療情報)
- 各属性のレビュー・評価値の関係を用いた評判情報の検索支援(「主観表現処理の最前線」シンポジウム)
- モバイルアドホック網における位置情報交換レスキューシステム(有線無線シームレス, モバイルネットワーキング, Mobile IP, 無線通信, ネットワーク制御, 一般)
- 重み更新規制の修正によるBoostingアルゴリズムの改善について(知識処理)
- 1R-7 Content-Free Image Retrievalを用いた個人の嗜好を満たすレシピ推薦システム(画像検索・画像情報処理,学生セッション,データベースとメディア)
- 部門間の関係に基づくインシデントレポート共有システムに関する研究(インターネット応用,夏のデータベースワークショップDBWS 2006)
- 時系列の類似性検索における上界関数による効率化(データマイニング)
- AMSS : 時系列データの効率的な類似度測定手法(データマイニング)