正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 日本語固有表現抽出の問題において, 複数のモデルの出力を混合する手法を提案する.混合の方式としては, 複数のシステム・モデルの出力(および訓練データそのもの)を入力とする第二段の学習器を用いて, 複数のシステム・モデルの出力の混合を行なう規則を学習するという混合法(stacking法)を採用する.第二段の学習器として決定リスト学習を用いて, 最大エントロピー法に基づく固有表現抽出モデルのうち, お互いに挙動の異なる固定文脈長モデルと可変文脈長モデルの出力を混合する実験を行なった結果, 最大エントロピー法に基づく固有表現抽出モデルにおいてこれまで得られていた最高の性能を上回る性能が達成された.
- 2001-07-09
著者
関連論文
- 日本語係り受け解析の線形時間アルゴリズム
- サポートベクタマシンを使った文書分類における仮想事例の利用
- 日本語単語分割を題材としたサポートベクタマシンの能動学習の実験的研究
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- AdaBoostと能動学習を用いたテキスト分類
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- ブートストラップによる低人手でコスト日本語固有表現抽出
- 統計的日本語固有表現抽出における固有表現まとめ上げ手法とその評価
- 有限状態変換器の誤り駆動型学習を用いた固有表現抽出
- 有限状態変換器の誤り駆動型学習を用いた固有表現抽出
- JUMANにおける形態素文法記述の問題点に関する考察
- 利用者による調節が可能な高速日本語形態素解析
- 大規模コーパスを用いた日本語機能表現呼応可能性規則の作成および日本語学習支援での利用
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 言語横断検索により自動収集された日英関連報道記事からの訳語対応の獲得
- 言語横断検索により自動収集された日英関連報道記事からの訳語対応の獲得
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 講演スタイルの解説番組を対象にした音声認識の検討
- 講演スタイルの解説番組を対象にした音声認識の検討
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 信頼度を利用した複数モデルの出力の混合
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 単語の特徴と信頼度の相関
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 音響モデルの組合せと信頼度の相関
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度の性能分析
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度の実験的評価
- 複数の音声認識システムの出力の共通部分を利用した確信度