連続量を変形要因とする重回帰モデルを内包するHMM
スポンサーリンク
概要
- 論文の詳細を見る
基本周波数(F_0)や発話スタイルなどの補助特徴量を用いて認識時に動的にモデルの適応を行う重回帰HMMを提案する。音声スペクトルはF_0や発話スタイルなど多くの変形要因により変化する。重回帰HMMは連続量を持つ変形要因に対する音声スペクトルの変化を重回帰モデルで表す。重回帰モデルをHMMの各隠れ状態に組み込むことにより、音素環境や音素内での時間的位置毎に、別々の重回帰モデルを持つことが可能となる。本報告では重回帰HMMの概念や基本的な定式化を説明し、EMアルゴリズムを用いて尤度最大基準でパラメータを推定するアルゴリズムを示す。変形要因にF_0を用いて切り出し音素認識と孤立単語認識を行った結果、従来のHMMと比較してそれぞれ15.3%、22.0%の誤り削減率が得られた。
- 社団法人電子情報通信学会の論文
- 2000-12-14
著者
-
下平 博
北陸先端科学技術大学院大学 情報科学研究科
-
嵯峨山 茂樹
北陸先端科学技術大学院大学情報科学研究科情報処理学専攻
-
中井 満
北陸先端科学技術大学院大学
-
下平 博
北陸先端科学技術大学院大学
-
藤永 勝久
Atr音声言語コミュニケーション研究所:北陸先端科学技術大学院大学 情報科学研究科
-
藤永 勝久
北陸先端科学技術大学院大学情報科学研究科
-
嵯峨山 茂樹
北陸先端科学技術大学院大学情報科学研究科
関連論文
- 最小分類誤り学習の汎化能力改善とニューラルネットワークへの応用
- ストロークHMMに基づくオンライン手書き文字認識の特徴量の検討
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 最尤推定を用いた声道長線形変換による話者正規化(音声言語情報処理とその応用)
- 最尤推定に基づく線形変換を用いた声道長正規化
- 最尤推定に基づく線形変換を用いた声道長正規化
- 最尤推定に基づく線形変換を用いた声道長正規化
- HMMを用いた音響演奏の楽譜追跡による弾き直しに追従可能な自動伴奏
- ストロークHMMオンライン文字認識方式の階層構造辞書を用いた筆順違い対策
- H-16 2次元Warpingを用いた頸椎X線画像の骨年齢評価(医用画像処理,H.生体情報科学)
- 階層的な文字部品間の位置関係を選択的に利用したオンライン手書き文字認識(一般セッション)
- 階層的な文字部品間の位置関係を選択的に利用したオンライン手書き文字認識(一般セッション)
- 環境依存型サブストロークHMMを用いたオンライン手書き文字認識(画像認識, コンピュータビジョン)
- サブストロークHMMを用いたオンライン手書き文字認識(画像認識, コンピュータビジョン)
- D-12-84 パターン間の合成写像を用いた非線形時間伸縮法の高速化(D-12.パターン認識・メディア理解A)
- 非同期遷移型HMMによる音声認識
- 確率的シソーラスに基づいたトリガー言語モデルの拡張
- ウェアラブル環境を想定した視覚障害者用オンライン手書き文字入力インタフェース
- 発声変形に対するヤコビ適応法
- 擬人化音声対話エージェントにおけるモジュール統合処理
- ストロークHMMを用いたオンライン重ね書き文字列認識
- ストロークHMMを用いたオンライン重ね書き文字列認識
- ストロークHMMを用いたオンライン重ね書き文字列認識
- 擬人化音声対話エージェントにおける発話時の頭部挙動モデル
- 隠れマルコフモデルによる音楽リズムの認識(音楽情報科学)
- 筆圧情報を併用したストロークHMMに基づくオンライン文字認識
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 複数の特徴ベクトル軌道を持つ環境依存音素クラスタの生成
- 環境依存型ストロークHMMを用いたオンライン手書き文字認識
- 複数混合分布を持つ順序制約付き非同期遷移型HMM
- 状態遷移に順序関係を持つ非同期遷移型HMM
- 特徴量間で状態遷移が非同期なHMM
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- HMMを用いた旋律への自動和声付けと調性推定
- 隠れマルコフモデルを用いた旋律への自動和声付け
- 隠れマルコフモデルを用いた旋律への自動和声付け
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェントツールキットGalatea
- 擬人化音声対話エージェント開発プロジェクト
- 擬人化音声対話エージェントツールキットの基本設計
- 擬人化音声対話エージェントツールキットの基本設計
- 日本語ディクテーション基本ソフトウェア(99年度版)
- F_0テンプレートbigramを用いた韻律句の係り受け構造推定に関する検討
- 低域スペクトルの予測残差を利用した非定常高騒音環境での有声音区間の検出
- 低域スペクトルの予測残差を利用した騒音環境下の音声区間検出
- 大脳視覚野における情報処理に基づく階層型SOMのパターン分類能力
- 大脳視覚野におけるV1野-IT野を模した階層型SOMのパターン分類能力(モデル化応用)
- HMMを用いた演奏データからのリズム認識
- 隠れマルコフモデルによる音楽演奏からの音符列の推定
- 線形予測符号化と複合正弦波モデル化の対称性
- 複合正弦波モデルによる音声スペクトルの分析
- 音声の分析・合成・認識 (情報の伝達と処理特集号) -- (情報処理)
- 視覚障害者を対象としたストロークHMMオンライン文字認識方式の性能評価
- ガンマチャープフィルタバンクの構築
- SP2000-15 ヤコビ行列を用いた雑音環境への適応法の拡張
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- ニューラルネットワークを用いたインド文字の特徴抽出について
- 対話システムにおけるモジュール統合とプロトタイピング
- HMMと音符n-gramを用いた音楽リズム認識
- ヤコビ適応法を用いた雑音環境・伝達特性・話者への同時適応
- 重回帰HMMを用いた不特定話者音声認識
- ストロークHMMを用いたオンライン非目視手書き文字認識の性能評価
- F_0 を変形要因とした重回帰 HMM を用いた音声認識
- 音声対話における音響・韻律信頼度を用いた応答タイミング制御の検討
- 連続量を変形要因とする重回帰モデルを内包するHMM
- 連続量を変形要因とする重回帰モデルを内包するHMM
- 連続量を変形要因とする重回帰モデルを内包するHMM
- 非線形時間伸縮を用いたSupport Vector Machineによる時系列パタンの認識
- ヤコビ適応法を用いた雑音環境と伝達特性への同時適応
- Support Vector Machineによる時系列パターンの認識
- Support Vector Machinesによる複数カテゴリの識別
- 周波数-変動長フィルタによる音声強調
- スペクトログラムのベイジアンノンパラメトリックモデリングに基づく音楽信号の解析
- 時間周波数分解能の異なるスペクトログラムの並列NMFによる多重音解析
- 周波数-変動長フィルタによる音声強調(聴覚一般,聴覚・音声・言語とその障害/一般)
- HMMを用いたオフライン手書き単語認識における環境クラスタリングとGMMの同時最適化(テーマセッション,文字・文書の認識と理解)
- 音声入力への応答タイミング決定のための強化学習の検討(音声一般・障害者支援,聴覚・音声・言語とその障害/一般)
- 共分散行列領域での雑音除去に基づく拡散性雑音に頑健な複数音源定位
- マイクロホンのペア分散配置によるブラインド音源分離とポストフィルタによる性能向上の検討
- F_0生成モデルを用いたテンプレートに基づく連続音声の句境界検出
- F_0生成モデルに基づくピッチパターン整合を用いた雑音重畳単語音声の認識
- F_0生成過程モデルの指令探索によるピッチパターンの再構成法
- 楽譜情報からの作曲家らしさ認識のための音楽特徴量の提案
- PRMU2000-36 ストロークHMMによるオンライン手書き文字認識の性能評価
- F0パターン生成過程の確率モデルによる藤崎モデルパラメータの推定
- 多声MIDI演奏の楽譜追跡における演奏の即興性のモデル化と自動伴奏への応用
- 声質空間上での変換に基づく歌声らしさの転写に関する検討
- 楽譜の文脈自由2次元木構造表現に基づく多重音スペクトログラム生成モデルによる音響信号からの自動採譜
- 補助関数法によるMIDI信号の音楽音響信号への詳細なフィッティング
- 確率的手法による歌唱曲の自動作曲(音楽制作と情報処理の友好関係)
- 数理モデルによる音楽情報処理(招待講演,時系列パターン認識)
- 数理モデルによる音楽情報処理(招待講演,時系列パターン認識)
- 入出力隠れマルコフモデルの復号によるギターのための自動編曲
- 2000-SLP-32-13 音声対話システムにおける擬人化エージェントの挙動の数理的モデル
- 音楽要素の分解再構成に基づく日本語歌詞からの旋律自動作曲
- 非音声区間情報を用いた補助関数型独立ベクトル分析による音声強調(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 非音声区間情報を用いた補助関数型独立ベクトル分析による音声強調(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)