Shift-Reduce法に基づく日本語固有表現抽出(一般セッション「分類と抽出」)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では日本語固有表現に対してShift-Reduce法に基づく抽出法を提案しIREX日本語固有表現抽出タスクを用いてその有効性を検証する.提案手法はShift-Reduce法に基づくことで,文頭から順に固有表現の語境界推定後にその種類を推定するという自然な解析が実現できる.また日本語における形態素単位解析では,形態素語境界と固有表現の語境界が異なる場合の誤抽出が問題となる.この問題に対し,提案手法は簡単な拡張アクションを追加することで,入力文全てを文字単位に解析することなく対処できる.CRL固有表現抽出データを用いた五分割交差検定による評価実験では,文頭から文末に向かって部分的に文字単位解析する効率的な方法で,0.88のF値を得た.
- 2007-05-24