統計的日本語固有表現抽出における固有表現まとめ上げ手法とその評価
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 統計的手法に基づく日本語固有表現のまとめ上げの問題に対して, 性能を大きく左右する四つの要因, i)固有表現のまとめ上げ状態の表現法, ii)現在位置の周囲の形態素を何個まで考慮するか, iii)個々の形態素の素性, iv)統計的学習法, について, これまで日本語固有表現のまとめ上げにおいてはその有効性が確認されていない幾つかの方式を実験的に評価し, その得失について報告する.特に, ii)について, 現在位置の形態素が, いくつの形態素から構成される固有表現の一部であるかを考慮して学習を行なう可変長モデルを新たに提案する.実験の結果, 先行研究で用いられた固定長モデルの性能を大きく上回る結果が得られ, 可変長モデルの有効性が確認できた.
- 2000-09-21
著者
関連論文
- 日本語係り受け解析の線形時間アルゴリズム
- サポートベクタマシンを使った文書分類における仮想事例の利用
- 日本語単語分割を題材としたサポートベクタマシンの能動学習の実験的研究
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- AdaBoostと能動学習を用いたテキスト分類
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- ブートストラップによる低人手でコスト日本語固有表現抽出
- 統計的日本語固有表現抽出における固有表現まとめ上げ手法とその評価
- 有限状態変換器の誤り駆動型学習を用いた固有表現抽出
- 有限状態変換器の誤り駆動型学習を用いた固有表現抽出
- JUMANにおける形態素文法記述の問題点に関する考察
- 利用者による調節が可能な高速日本語形態素解析
- 大規模コーパスを用いた日本語機能表現呼応可能性規則の作成および日本語学習支援での利用
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 言語横断検索により自動収集された日英関連報道記事からの訳語対応の獲得
- 言語横断検索により自動収集された日英関連報道記事からの訳語対応の獲得
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 講演スタイルの解説番組を対象にした音声認識の検討
- 講演スタイルの解説番組を対象にした音声認識の検討
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 信頼度を利用した複数モデルの出力の混合
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 単語の特徴と信頼度の相関
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 音響モデルの組合せと信頼度の相関
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度の性能分析
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度の実験的評価
- 複数の音声認識システムの出力の共通部分を利用した確信度