セグメント単位の評価指標最大化に基づく条件付確率場の学習(自然言語処理)
スポンサーリンク
概要
- 論文の詳細を見る
サンプル間に依存関係があるデータに対して大域的な最適化による識別学習を行うモデルとして,条件付確率場が提案され多くの実タスクで良好な性能を示している.条件付確率場のパラメータ推定(学習)は,確率場全体のゆう度,あるいは,事後確率に基づく目的関数を最大化する方法が一般的である.しかし,実タスクを評価する際に用いる評価指標は,ゆう度や事後確率でなく,タスクの目的に合わせてF値等の様々な評価関数が用いられる.そのために,タスクの評価指標と学習時の目的関数間にはしばしば不整合が起きることがある.しかし,この不整合についてはこれまでほとんど考慮されてこなかった.そこで本論文では,条件付確率場の適用先として多く用いられている系列セグメンテーションタスクに焦点を当て,系列セグメンテーションタスクの評価に使う評価指標を直接学習時の目的関数として利用し,期待性能を向上させる枠組みを提案する.具体的には,セグメント単位の再現率,適合率,F値といったタスク評価指標を学習時の目的関数として導入する方法を提案する.実タスクでの実験として自然言語処理のチャンキング,固有表現抽出タスクを用いて提案法の性能を検証する.実際に用いるタスクの評価指標と学習時の目的関数を合わせることで,適用した評価指標での性能向上が可能であることを示す.
- 2011-05-01
著者
-
鈴木 潤
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
鈴木 潤
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
関連論文
- 最適化問題としての文書要約
- モデル検査に基づく知識・信念の推定(「定理証明, 推論関係の新技術」)
- 抜粋による複数文書要約を評価するためのコーパスと評価指標
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- F値最大化学習に基づく文書の多重ラベリング(機械学習)
- 高次元特徴空間に適した半教師あり条件付確率場の検証(機械学習)
- 識別学習による組合せ最適化問題としての文短縮手法
- 単一言語コーパスにおける文の自動対応付け手法(自然言語)
- 階層非循環有向グラフカーネル(情報論的学習理論論文)
- SVMを用いた学習型質問応答システムSAIQA-II(自然言語)
- 単語属性N-gramと統計的機械学習による質問タイプ同定(自然言語)(「インタラクション:理論,技術,応用,評価」)
- 機械学習のための組み合わせ素性の選択基準について(分類、クラスタリング,機械学習)
- 言語パターンに着目した複数文書要約(要約)
- 機械学習のための組み合わせ素性の選択基準について(分類、クラスタリング, 機械学習)(言語理解とコミュニケーション)
- 言語パターンに着目した複数文書要約(言語理解とコミュニケーション)
- 機械学習のための組み合わせ素性の選択基準について
- 言語パターンに着目した複数文書要約
- 素性選択機能をもったString Kernelの提案(パタン発見)(セマンティックウェブと自然言語処理その他一般)
- 素性選択機能をもった String Kernel の提案
- 階層構造を利用したテキスト間類似度の効率的計算法
- LE-10 統計的機械学習を用いた質問タイプ同定(E. 自然言語・文書)
- SAIQA : 大量文書に基づく質問応答システム
- SAIQA : 大量文書に基づく質問応答システム
- 聞き役対話システムの構築を目的とした聞き役対話の分析
- 構文情報に依存しない文短縮手法
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- 投票型回帰モデルによる要約の自動評価法
- 辞書式順序を持つペナルティによるゼロ代名詞解消(自然言語)
- 拡張ストリングカーネルを用いた要約システムの自動評価法(自然言語,情報処理技術のフロンティア)
- 最大マージン原理に基づく多重ラベリング学習(自然言語処理)
- 文書要約の自動評価手法の提案と評価(セグメンテーション・要約)
- 優先度学習を用いた自然言語処理(解析)
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出,マイニング)
- 自然言語処理のためのSVM高速化
- 自然言語処理のためのSVM高速化
- 音声インタラクティブODQAの構築とその評価
- 質問応答システムの比較と評価
- 固有表現抽出のためのSVMの高速化
- 質問応答システム:SAIQA--何でも答える物知り博士 (特集論文1 高度検索技術)
- 質問に適応した文書要約手法とその評価
- 世界図書館を飲み込む次世代ヒューマノイド--知識処理と言語処理の新しい展開 (特集論文1 人にやさしい対話型コンピュータ)
- AAAI-99参加報告
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出, マイニング)(言語理解とコミュニケーション)
- 音声駆動型QAシステム実現のための言語モデルと対話戦略の検討 (テーマ:一般)
- 4. 論理の逆計算 : 計算機科学の立場から( 逆計算: 計算の理論における逆問題)
- 生物医学文献からの遺伝子機能フレーズの抽出
- セグメント単位の評価指標最大化に基づく条件付確率場の学習
- Support Vector Machineを用いた重要文抽出法(自然言語)
- 機械学習による複数文書からの重要文抽出
- LE-11 機械学習を用いた複数文書要約(E. 自然言語・文書)
- SVMに基づく固有表現抽出の高速化
- メタルールと決定木学習を用いた日本語固有表現抽出(システムLSIの設計技術と設計自動化)
- 固有表現抽出のための可読性の高い規則の自動生成
- 並行実行される固有表現抽出規則の一括生成
- 辞書式優先順位に基づく日本語固有表現抽出
- マルチエージェント環境で他者の信念の変遷を推定する前進的アルゴリズム
- セグメント単位の評価指標最大化に基づく条件付確率場の学習(自然言語処理)
- 大規模データを用いた半教師あり学習による高精度係り受け解析モデルの学習
- マルチエージェント環境における遡行的信念推定アルゴリズム
- トランザクション論理におけるプログラム変換
- 不均衡データにおける偽陽性率を考慮したスパム判別器のオンライン学習
- D-007 偽陽性率に着目したオンライン学習を用いたスパム判別(Web,D分野:データベース)