高次元特徴空間に適した半教師あり条件付確率場の検証(機械学習)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,半教師あり条件付確率場(Semi-supervised conditional random fields)について議論をおこなう.自然言語処理の多くのタスクでは,効果的なモデル学習のために単語やその連接といった特徴を利用する必要があり,一般的に数万次元以上という高次元かつスパースな特徴空間を用いて学習をおこなう必要がある.よって,これらのタスクでは,半教師あり学習の枠組みにおいても,高次元スパース特徴空間に頑健な枠組が求められる.そこで,本稿では,文献[1]の枠組をベースにし,高次元スパース特徴空間に対して頑健な半教師あり条件付確率場を新たに提案する.また,固有表現抽出およびチャンキングタスクを用いて半教師あり条件付確率場の性能と性質について検証をおこなった.提案法により,従来の教師あり条件付確率場[2],エントロピー正則化に基づく半教師あり条件付確率場[3]と比較して大幅に良い結果が得られた.また,エントロピー正則化に基づく半教師あり条件付確率場は,理論的にも実験的にも,高次元スパース特徴空間を用いた学習では性能の向上が期待できないことを明らかにする.
- 一般社団法人情報処理学会の論文
- 2007-09-25
著者
-
鈴木 潤
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
藤野 昭典
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
磯崎 秀樹
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
鈴木 潤
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
藤野 昭典
NTTコミュニケーション科学基礎研究所
関連論文
- 最適化問題としての文書要約
- モデル検査に基づく知識・信念の推定(「定理証明, 推論関係の新技術」)
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法(Session 1)
- テキスト自動分類のための半教師あり学習技術 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 半教師あり学習に基づく異種情報データの分類(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 半教師あり学習のための生成・識別ハイブリッド分類器の設計法
- 最大エントロピー原理に基づく付加情報の効果的な利用によるテキスト分類(情報検索)
- LI-009 生成・識別ハイブリッドモデルに基づく半教師あり学習(I分野:画像認識・メディア理解)
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 文書の構成要素モデルのアンサンブル学習に基づくテキスト分類(一般)
- LD-001 交差確認法に基づく適合性フィードバック(D. データベース)
- コーパスからのキーワード自動抽出(抽出)
- 抜粋による複数文書要約を評価するためのコーパスと評価指標
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- F値最大化学習に基づく文書の多重ラベリング(機械学習)
- 高次元特徴空間に適した半教師あり条件付確率場の検証(機械学習)
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 適合フィードバックにおける単語選択法(検索・多義性解消)
- 無声子音における舌・唇と喉頭の調音運動の時間関係の分析
- 無声子音における調音・声門運動のタイミングの分布 - 促音の有無による比較 -
- 識別学習による組合せ最適化問題としての文短縮手法
- 単一言語コーパスにおける文の自動対応付け手法(自然言語)
- 階層非循環有向グラフカーネル(情報論的学習理論論文)
- SVMを用いた学習型質問応答システムSAIQA-II(自然言語)
- 単語属性N-gramと統計的機械学習による質問タイプ同定(自然言語)(「インタラクション:理論,技術,応用,評価」)
- 機械学習のための組み合わせ素性の選択基準について(分類、クラスタリング,機械学習)
- 言語パターンに着目した複数文書要約(要約)
- 機械学習のための組み合わせ素性の選択基準について(分類、クラスタリング, 機械学習)(言語理解とコミュニケーション)
- 言語パターンに着目した複数文書要約(言語理解とコミュニケーション)
- 機械学習のための組み合わせ素性の選択基準について
- 言語パターンに着目した複数文書要約
- 素性選択機能をもったString Kernelの提案(パタン発見)(セマンティックウェブと自然言語処理その他一般)
- 素性選択機能をもった String Kernel の提案
- 階層構造を利用したテキスト間類似度の効率的計算法
- LE-10 統計的機械学習を用いた質問タイプ同定(E. 自然言語・文書)
- SAIQA : 大量文書に基づく質問応答システム
- SAIQA : 大量文書に基づく質問応答システム
- ラベルありデータの選択バイアスに頑健な半教師あり学習
- 同義語情報を用いた確率的単語アライメントモデル
- 適合性分布が異なる情報源を用いたランキング学習
- 聞き役対話システムの構築を目的とした聞き役対話の分析
- 構文情報に依存しない文短縮手法
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- 投票型回帰モデルによる要約の自動評価法
- 辞書式順序を持つペナルティによるゼロ代名詞解消(自然言語)
- 拡張ストリングカーネルを用いた要約システムの自動評価法(自然言語,情報処理技術のフロンティア)
- 最大マージン原理に基づく多重ラベリング学習(自然言語処理)
- 文書要約の自動評価手法の提案と評価(セグメンテーション・要約)
- 優先度学習を用いた自然言語処理(解析)
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出,マイニング)
- 無声子音発声時の舌・喉頭運動における発声の強さの影響(聴覚,音声,言語とその障害)
- 無声子音の発話運動における発声の強さの影響の分析
- 音声生成における発話協調動作機構
- 促音が先行する無声子音の調音・声門運動タイミングの分析
- 口蓋形摂動に対する調音補償動作の分析
- 無声子音の生成における声門運動の時間パタンの分析
- 無声子音生成における調音器官と声門の運動タイミングの分析
- 磁気センサシステムおよびフォトグロットグラフを用いた調音器官と声門の運動観測
- 自然言語処理のためのSVM高速化
- 自然言語処理のためのSVM高速化
- 音声インタラクティブODQAの構築とその評価
- 質問応答システムの比較と評価
- 固有表現抽出のためのSVMの高速化
- 質問応答システム:SAIQA--何でも答える物知り博士 (特集論文1 高度検索技術)
- 質問に適応した文書要約手法とその評価
- 世界図書館を飲み込む次世代ヒューマノイド--知識処理と言語処理の新しい展開 (特集論文1 人にやさしい対話型コンピュータ)
- AAAI-99参加報告
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出, マイニング)(言語理解とコミュニケーション)
- 経験強化を考慮したQ-Learningの提案とその応用
- 音声駆動型QAシステム実現のための言語モデルと対話戦略の検討 (テーマ:一般)
- 4. 論理の逆計算 : 計算機科学の立場から( 逆計算: 計算の理論における逆問題)
- 生物医学文献からの遺伝子機能フレーズの抽出
- セグメント単位の評価指標最大化に基づく条件付確率場の学習
- Support Vector Machineを用いた重要文抽出法(自然言語)
- 機械学習による複数文書からの重要文抽出
- LE-11 機械学習を用いた複数文書要約(E. 自然言語・文書)
- SVMに基づく固有表現抽出の高速化
- メタルールと決定木学習を用いた日本語固有表現抽出(システムLSIの設計技術と設計自動化)
- 固有表現抽出のための可読性の高い規則の自動生成
- 並行実行される固有表現抽出規則の一括生成
- 辞書式優先順位に基づく日本語固有表現抽出
- マルチエージェント環境で他者の信念の変遷を推定する前進的アルゴリズム
- セグメント単位の評価指標最大化に基づく条件付確率場の学習(自然言語処理)
- 大規模データを用いた半教師あり学習による高精度係り受け解析モデルの学習
- 日本語語義曖昧性解消のための訓練データの自動拡張
- Pitman-Yor過程に基づく確率的木挿入文法モデル
- 予測尤度最大化に基づく誤分類サンプルの検出(ポスターセッション,第14回情報論的学習理論ワークショップ)
- マルチエージェント環境における遡行的信念推定アルゴリズム
- トランザクション論理におけるプログラム変換
- 不均衡データにおける偽陽性率を考慮したスパム判別器のオンライン学習
- 予測尤度最大化に基づく誤分類サンプルの検出
- D-007 偽陽性率に着目したオンライン学習を用いたスパム判別(Web,D分野:データベース)