有限状態変換器の誤り駆動型学習を用いた固有表現抽出
スポンサーリンク
概要
- 論文の詳細を見る
本論文では、Eric Brillが提案した変換に基づく誤り駆動型学習を日本語の固有表現抽出に適用する方法について述べる。形態素解析と学習で獲得した有限状態変換器(FST)を遣って固有表現の抽出を行うシステムを作成し、IREX (Information Retrieval and Extraction Exercise)の named entity task のformal run (総合ドメイン)に対して実験を行った。約10,000文のCRL固有表現データから1428個のFSTを学習し、F-measure 71.28を得た。人手作成のFSTの性能には及ばないものの、IREX NEに参加するシステムの半数よりもいい結果である。また、過学習が起きないことも確認した。
- 1999-07-22
著者
関連論文
- 日本語係り受け解析の線形時間アルゴリズム
- サポートベクタマシンを使った文書分類における仮想事例の利用
- 日本語単語分割を題材としたサポートベクタマシンの能動学習の実験的研究
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- AdaBoostと能動学習を用いたテキスト分類
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- ブートストラップによる低人手でコスト日本語固有表現抽出
- 統計的日本語固有表現抽出における固有表現まとめ上げ手法とその評価
- 有限状態変換器の誤り駆動型学習を用いた固有表現抽出
- 有限状態変換器の誤り駆動型学習を用いた固有表現抽出
- JUMANにおける形態素文法記述の問題点に関する考察
- 利用者による調節が可能な高速日本語形態素解析