正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合

スポンサーリンク

概要

論文の詳細を見る
本論文では, 日本語固有表現抽出の問題において, 複数のモデルの出力を混合する手法を提案する.混合の方式としては, 複数のシステム・モデルの出力(および訓練データそのもの)を入力とする第二段の学習器を用いて, 複数のシステム・モデルの出力の混合を行なう規則を学習するという混合法(stacking法)を採用する.第二段の学習器として決定リスト学習を用いて, 最大エントロピー法に基づく固有表現抽出モデルのうち, お互いに挙動の異なる固定文脈長モデルと可変文脈長モデルの出力を混合する実験を行なった結果, 最大エントロピー法に基づく固有表現抽出モデルにおいてこれまで得られていた最高の性能を上回る性能が達成された.
2001-07-09

著者

関連論文

もっと見る

スポンサーリンク