Boostingに基づく系列ラベリングにおける効率的規則表現方法による高速化
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,品詞タグ付け,Text Chunkingといった系列ラベリングにおける高速化手法を提案する.まず,系列ラベリング向けの規則表現方法を提案する.通常の系列ラベリング問題では,判別対象の単語から得られる素性に加えて,その前後の単語から得られる素性を用いる.そのため,判別対象の単語からの相対位置により,各単語から得られる素性が,異なる素性として,複数回処理されるという問題がある.本稿では,この相対位置による違いを吸収可能な規則表現方法による判別方法を提案する.また,素性の組合せを規則として学習するBoostingアルゴリズムにおいて,素性の組合せ生成を制御する手法を提案する.素性の組合せを考慮することで,精度改善に貢献するが,処理速度が低下するという問題がある.本手法では,組合せに考慮される素性とされない素性の2種類に分けることで,組合せ生成を調整し,高速化を行う.本手法を,英語品詞タグ付け,Text Chunkingで評価した結果,精度を保持したまま,速度改善が得られることを確認した.
- 2011-07-15
著者
関連論文
- 大規模自然言語処理学習データのための複数弱仮説を生成する弱学習器を用いる AdaBoost 手法
- 企業内情報検索の高度化手法の提案と評価
- Boostingに基づく規則学習における部分候補を用いた高速化手法
- ラベルなしデータを用いた素性増強による日本語固有表現抽出方法
- Stackingの効率的な学習方法と日本語固有表現抽出での評価(抽出(1))
- Stackingの効率的な学習方法と日本語固有表現抽出での評価(抽出(1))
- Boostingに基づく系列ラベリングにおける効率的規則表現方法による高速化
- Kura:統一的かつ宣言的記述法に基づく言い換え知識の開発環境
- Twitterからの犯罪情報抽出の可能性調査