ブートストラップによる低人手でコスト日本語固有表現抽出
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 人手によって作成された少量の初期固有表現リストと大量の人手未解析コーパスから, ブートストラップにより日本語固有表現抽出規則を学習する手法を提案し, その実験的評価結果を報告する.実験の結果, ブートストラップのサイクルを経るにしたがって, 初期固有表現リストによる固有表現抽出の性能(F値)が徐々に改善されるという結果が得られた.この結果により, 少量の初期知識と大量の人手未解析コーパスを用いたブートストラップ法のアプローチが, 日本語の固有表現のまとめ上げの問題においても, ある程度有効に機能することが確認できた.
- 2000-09-21
著者
関連論文
- 日本語係り受け解析の線形時間アルゴリズム
- サポートベクタマシンを使った文書分類における仮想事例の利用
- 日本語単語分割を題材としたサポートベクタマシンの能動学習の実験的研究
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- AdaBoostと能動学習を用いたテキスト分類
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- ブートストラップによる低人手でコスト日本語固有表現抽出
- 統計的日本語固有表現抽出における固有表現まとめ上げ手法とその評価
- 有限状態変換器の誤り駆動型学習を用いた固有表現抽出
- 有限状態変換器の誤り駆動型学習を用いた固有表現抽出
- JUMANにおける形態素文法記述の問題点に関する考察
- 利用者による調節が可能な高速日本語形態素解析
- 大規模コーパスを用いた日本語機能表現呼応可能性規則の作成および日本語学習支援での利用
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 言語横断検索により自動収集された日英関連報道記事からの訳語対応の獲得
- 言語横断検索により自動収集された日英関連報道記事からの訳語対応の獲得
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 講演スタイルの解説番組を対象にした音声認識の検討
- 講演スタイルの解説番組を対象にした音声認識の検討
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 信頼度を利用した複数モデルの出力の混合
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 単語の特徴と信頼度の相関
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度 : 音響モデルの組合せと信頼度の相関
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度の性能分析
- 複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度の実験的評価
- 複数の音声認識システムの出力の共通部分を利用した確信度