非同期遷移型HMMによる音声認識
スポンサーリンク
概要
- 論文の詳細を見る
音響特徴ベクトル時系列における個々の特徴量間の時間非同期遷移構造に着目した非同期遷移型HMM (Asynchronous Transition Hidden Markov Model : AT-HMM)を提案する.従来のHMMは音声特徴量を多次元ベクトル分布をもつ状態の連鎖により表現しているため,ベクトルを構成しているすべての特徴量の値が状態遷移に同期して変化することを仮定したモデルとなっている.しかし,一般に音声認識において用いられる音響特徴パラメータの個々の特徴量は必ずしも同期して変化していない.例えばゲプストラム特徴量とその時間微分特徴量は原理的に同期して変化しない.お互いに同期して変化する特徴量は同時に状態遷移し,同期しない特徴量は別々に状態遷移するモデル用いることにより,より効果的に音響特徴ベクトル時系列を表現することができると考えられる.本論文では,種々の時間非同遷移構造を考察し,特に個々の特徴量の状態遷移に順序関係のあるAT-HMMについて,特定及び不特定話者連続音素認識の評価実験を行った.特定話者の結果TA-HMMは従来型HMMと比較して10%から40%程度の誤り削減率が得られた.ただし,不特定話者に対しては,従来型HMMと同程度の音素認識率となった.
- 社団法人電子情報通信学会の論文
- 2003-06-01
著者
関連論文
- 最小分類誤り学習の汎化能力改善とニューラルネットワークへの応用
- ストロークHMMに基づくオンライン手書き文字認識の特徴量の検討
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 最尤推定を用いた声道長線形変換による話者正規化(音声言語情報処理とその応用)
- 最尤推定に基づく線形変換を用いた声道長正規化
- 最尤推定に基づく線形変換を用いた声道長正規化
- 最尤推定に基づく線形変換を用いた声道長正規化
- ストロークHMMオンライン文字認識方式の階層構造辞書を用いた筆順違い対策
- H-16 2次元Warpingを用いた頸椎X線画像の骨年齢評価(医用画像処理,H.生体情報科学)
- 階層的な文字部品間の位置関係を選択的に利用したオンライン手書き文字認識(一般セッション)
- 階層的な文字部品間の位置関係を選択的に利用したオンライン手書き文字認識(一般セッション)
- 環境依存型サブストロークHMMを用いたオンライン手書き文字認識(画像認識, コンピュータビジョン)
- サブストロークHMMを用いたオンライン手書き文字認識(画像認識, コンピュータビジョン)
- D-12-84 パターン間の合成写像を用いた非線形時間伸縮法の高速化(D-12.パターン認識・メディア理解A)
- 非同期遷移型HMMによる音声認識
- 確率的シソーラスに基づいたトリガー言語モデルの拡張
- ウェアラブル環境を想定した視覚障害者用オンライン手書き文字入力インタフェース
- 発声変形に対するヤコビ適応法
- 擬人化音声対話エージェントにおけるモジュール統合処理
- ストロークHMMを用いたオンライン重ね書き文字列認識
- ストロークHMMを用いたオンライン重ね書き文字列認識
- ストロークHMMを用いたオンライン重ね書き文字列認識
- 擬人化音声対話エージェントにおける発話時の頭部挙動モデル
- 隠れマルコフモデルによる音楽リズムの認識(音楽情報科学)
- 筆圧情報を併用したストロークHMMに基づくオンライン文字認識
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 複数の特徴ベクトル軌道を持つ環境依存音素クラスタの生成
- 環境依存型ストロークHMMを用いたオンライン手書き文字認識
- 複数混合分布を持つ順序制約付き非同期遷移型HMM
- 順序制約付き非同期遷移型HMMによる連続音素認識
- 状態遷移に順序関係を持つ非同期遷移型HMM
- 状態遷移に順序関係を持つ非同期遷移型HMM
- 状態遷移に順序関係を持つ非同期遷移型HMM
- 非同期遷移型HMM
- 特徴量間で状態遷移が非同期なHMM
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- HMMを用いた旋律への自動和声付けと調性推定
- 隠れマルコフモデルを用いた旋律への自動和声付け
- 隠れマルコフモデルを用いた旋律への自動和声付け
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェントツールキットGalatea
- 擬人化音声対話エージェント開発プロジェクト
- 擬人化音声対話エージェントツールキットの基本設計
- 擬人化音声対話エージェントツールキットの基本設計
- F_0テンプレートbigramを用いた韻律句の係り受け構造推定に関する検討
- 低域スペクトルの予測残差を利用した非定常高騒音環境での有声音区間の検出
- 低域スペクトルの予測残差を利用した騒音環境下の音声区間検出
- 大脳視覚野における情報処理に基づく階層型SOMのパターン分類能力
- 大脳視覚野におけるV1野-IT野を模した階層型SOMのパターン分類能力(モデル化応用)
- HMMを用いた演奏データからのリズム認識
- 隠れマルコフモデルによる音楽演奏からの音符列の推定
- 8パズルの高速解法
- 視覚障害者を対象としたストロークHMMオンライン文字認識方式の性能評価
- ガンマチャープフィルタバンクの構築
- SP2000-15 ヤコビ行列を用いた雑音環境への適応法の拡張
- ニューラルネットワークを用いたインド文字の特徴抽出について
- 対話システムにおけるモジュール統合とプロトタイピング
- HMMと音符n-gramを用いた音楽リズム認識
- ヤコビ適応法を用いた雑音環境・伝達特性・話者への同時適応
- 重回帰HMMを用いた不特定話者音声認識
- ストロークHMMを用いたオンライン非目視手書き文字認識の性能評価
- F_0 を変形要因とした重回帰 HMM を用いた音声認識
- 音声対話における音響・韻律信頼度を用いた応答タイミング制御の検討
- 連続量を変形要因とする重回帰モデルを内包するHMM
- 連続量を変形要因とする重回帰モデルを内包するHMM
- 連続量を変形要因とする重回帰モデルを内包するHMM
- 非線形時間伸縮を用いたSupport Vector Machineによる時系列パタンの認識
- ヤコビ適応法を用いた雑音環境と伝達特性への同時適応
- Support Vector Machineによる時系列パターンの認識
- Support Vector Machinesによる複数カテゴリの識別
- 視覚障害者用パーソナルOCRシステムの設計(バリアフリーインタフェース)
- 実時間意思決定システムに関する一提案
- 相互作用モデルに基づいたHI設計方法の検討
- F_0生成モデルを用いたテンプレートに基づく連続音声の句境界検出
- 韻律モデルを用いたF_Oクラスタリングに基づくアクセント句境界検出
- N^2-1パズルのスケールダウン解法(計算量理論とアルゴリズム論文小特集)
- 航空機パイロットの知識構造に関する一考察
- 実時間意思決定モデルの一提案とその応用
- F_0生成モデルに基づくピッチパターン整合を用いた雑音重畳単語音声の認識
- 矩形レイアウトモデルに基づく文書画像の領域識別 : 文書見出しの識別
- F_0生成過程モデルの指令探索によるピッチパターンの再構成法
- PRMU2000-36 ストロークHMMによるオンライン手書き文字認識の性能評価
- インタラクティブ性を重視した擬人化音声対話エージェントの基本設計 (テーマ なぜインタラクションでなければならないか?)
- 2000-SLP-32-13 音声対話システムにおける擬人化エージェントの挙動の数理的モデル