LVQ-HMM混合アルゴリズムの再評価
スポンサーリンク
概要
- 論文の詳細を見る
The LVQ-HMM hybrid algorithm was one of the first algorithms proposed in a recent approach aiming to integrate a highly discriminative artificial neural network-based classifier with an HMM capable of representing temporal structure effectively. The high phoneme classification capability of LVQ-HMM has already been demonstrated. However, the performance of LVQ-HMM has been less striking in more difficult, large-scale speech recognition situations, making evaluation of the algorithm controversial and suggesting a more detailed investigation of the properties of the algorithm in such situations. This technical report is thus devoted to re-evaluation of the hybrid algorithm, evaluated for word and phrase recognition task. Specifically, recognition experiments are conducted under rather difficult, speaker-independent and large-vocabulary conditions. Our recognizer uses a phoneme-based strategy; in particular, the predictive LR-parser is incorporated for efficient recognition. Experimental results alone are unfortunately insufficient to cease the controversy. However, possible contributions and aspects of the algorithm needing further improvement are brought to light.
- 社団法人日本音響学会の論文
著者
-
片桐 滋
Atr Auditory And Visual Perception Research Laboratories
-
マクダーモット エリック
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
マクダーモット エリック
NTTコミュニケーション科学基礎研究所
-
片桐 滋
同志社大学大学院工学研究科
-
岩見田 均
ATR Auditory and Visual Perception Research Laboratories
-
マクダーモット エリック
ATR Auditory and Visual Perception Research Laboratories
関連論文
- 損失関数平滑度の自動制御を伴う最小分類誤り学習法 (情報論的学習理論と機械学習)
- 損失関数平滑度の自動制御を伴う最小分類誤り学習法 (パターン認識・メディア理解)
- 粒子フィルタと最小分類誤り学習を用いる指映像認識(一般セッション,一般物体認識・画像特徴量)
- アンサンブル型最小分類誤り学習法の実装と実験的評価(一般セッション,CV・パターン認識のための学習・最適化)
- アンサンブル型最小分類誤り学習の提案(テーマ関連セッション2,コンピュータビジョンとパターン認識のための学習理論)
- アンサンブル型最小分類誤り学習の提案(テーマ関連セッション2)
- 映像フィードバックに伴うエコーのキャンセリング法に関する実験的評価(一般セッション,一般物体認識・画像特徴量)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- カルマンフィルタによる音声認識のための特徴量トラジェクトリ生成法
- 静的特徴量時系列と動的特徴量時系列の関係を用いたトラジェクトリパラメータ生成による音声認識手法
- 大語彙連続音声認識におけるビームサーチ性能向上のための言語モデル同期化法
- 有限状態変換器で定義される任意の音声認識タスクのための時間同期ビタービデコーダ
- 最大幾何マージン最小分類誤り学習法を目指して
- 判別関数の一般形に対する幾何マージンの導出とその制御を伴う最小分類誤り学習(テーマセッション,CV・パターン認識のための学習・最適化)
- 最小分類誤り学習における幾何マージンの制御法について(音響モデル,認識,理解,対話,一般)
- プロトタイプ型分類器設計における最小分類誤り学習法とサポートベクターマシンの比較 (パターン認識・メディア理解)
- t-Room環境に適したVPN接続手法の選定とQoSによる動的通信帯域制御手法の提案
- t-Room環境に適したVPN接続手法の選定とQoSによる動的通信帯域制御手法の提案
- 最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識
- t-Roomにおける接続先実行環境を考慮した動的制御の提案と開発
- t-Roomにおける接続先実行環境を考慮した動的制御の提案と開発
- t-Roomのための遠隔合奏支援システムの構築
- t-Roomのための遠隔合奏支援システムの構築
- t-Room環境に適したVPN接続手法の選定とQoSによる動的通信帯域制御手法の提案
- 最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識
- t-Roomにおける接続先実行環境を考慮した動的制御の提案と開発
- 音素弁別特徴ベクトルを用いた頑健な音声認識の検討
- 音素弁別特徴ベクトルを用いた頑健な音声認識の検討
- t-Roomのための遠隔合奏支援システムの構築
- 未来の電話「t-Room」のための開発支援システムの提案
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 損失関数平滑度の自動制御を伴う最小分類誤り学習法(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 損失関数平滑度の自動制御を伴う最小分類誤り学習法(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- カーネルに基づく高次元空間における大幾何マージン最小分類誤り学習の提案 (パターン認識・メディア理解)
- 最小識別誤り学習と重み付き有限状態トランスデューサによる大語彙音声認識
- 最小分類誤りを用いた連続音素認識の最適化
- LVQ-HMM混合アルゴリズムの再評価
- t-Room のための遠隔合奏支援システムの構築
- t-Room のための遠隔合奏支援システムの構築
- 識別的特徴抽出に基づく話者認識 : メルケプストラム特徴の最適化
- 識別的特徴抽出に基づく話者認識 -2次オールパス関数に基づくメルケプストラム特徴の最適化-
- 最小検出誤り学習法による未知音の検出
- 一般化確率的降下法を用いる信号検出法
- 識別的計量設計法に基づく低次元空間での特徴表現
- 音声認識のための最小歪分節化/LVQ混合アルゴリズム
- 未来の電話「t-Room」のための開発支援システムの提案
- 連続音声認識のためのスポッティングに基づく新しい接近法 : 最小誤りキーワード列分類
- 逐次増加型最小分類誤り学習によるパターン認識
- 逐次増加型最小分類誤り学習によるパターン認識(パターン認識)
- F-048 回帰診断に基づく医療データの補間の検討(人工知能・ゲーム,一般論文)
- カーネルに基づく高次元空間における大幾何マージン最小分類誤り学習の提案(テーマセッション,PRMUのフロンティア・グランドチャレンジ)
- 大幾何マージン最小分類誤り学習に対する損失関数平滑度の自動制御の適用(一般セッション,文字・文書の認識と理解)
- プロトタイプ型分類器設計における最小分類誤り学習法とサポートベクターマシンの比較(テーマセッション+一般セッション,PRMUのフロンティア・グランドチャレンジ)
- 生成モデルを用いた音声認識(国際ワークショップ"Beyond HMM")
- 生成モデルを用いた音声認識(国際ワークショップ"Beyond HMM")
- 生成モデルを用いた音声認識(国際ワークショップ"Beyond HMM")
- 幾何マージンに基づく誤分類尺度を用いた最小分類誤り学習法(パターン認識)
- ローカル・ラグ制御機能を持つ音響サーバを用いた遠隔合奏の評価
- ローカル・ラグ制御機能とログ同期機能を持つ音響サーバの開発
- 粒子フィルタと最小分類誤り学習を用いた映像オブジェクト追跡法の検討 (画像工学)
- 遠隔協働支援システム「t-Room」における映像オブジェクト抽出法の改良 (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
- 遠隔コラボレーション支援システム「t-Room」における複数カメラ映像を用いた利用者追跡 (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
- 粒子フィルタと最小分類誤り学習を用いた映像オブジェクト追跡法の検討 (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
- 遠隔コラボレーション支援システム「t-Room」における複数カメラ映像を用いた利用者追跡 (ITS)
- 遠隔コラボレーション支援システム「t-Room」における複数カメラ映像を用いた利用者追跡 (画像工学)
- 遠隔協働支援システム「t-Room」における映像オブジェクト抽出法の改良 (ITS)
- 遠隔協働支援システム「t-Room」における映像オブジェクト抽出法の改良 (画像工学)
- 粒子フィルタと最小分類誤り学習を用いた映像オブジェクト追跡法の検討 (ITS)
- 位置情報に基づくインタラクティブ映像探索手法の提案(視聴覚技術,ヒューマンインタフェースおよび一般)
- 遠隔協働支援システム「t-Room」における映像オブジェクト抽出法の改良(ITS画像処理,映像メディア,視覚及び一般)
- 粒子フィルタと最小分類誤り学習を用いた映像オブジェクト追跡法の検討(ITS画像処理,映像メディア,視覚及び一般)
- 遠隔協働支援システム「t-Room」における映像オブジェクト抽出法の改良(ITS画像処理,映像メディア,視覚及び一般)
- 粒子フィルタと最小分類誤り学習を用いた映像オブジェクト追跡法の検討(ITS画像処理,映像メディア,視覚及び一般)
- 遠隔コラボレーション支援システム「t-Room」における複数カメラ映像を用いた利用者追跡(ITS画像処理,映像メディア,視覚及び一般)
- 遠隔コラボレーション支援システム「t-Room」における複数カメラ映像を用いた利用者追跡(ITS画像処理,映像メディア,視覚及び一般)
- 単眼カメラを搭載したラジコンヘリコプターを用いた全周パノラマ画像の生成