ケプストラム正規化の実行単位に関する実験的検証(研究速報)
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,音声認識における代表的なケプストラム正規化法であるCMN及びMVNの実行単位に関して,連続数字発話認識タスクを用いた実験的な検証を行い,従来報告されていない,いくつかの傾向を明らかにした.まず,実行単位として,移動平均,発話平均,話者平均,全体平均の四つを採用し,音響モデル学習時と認識時でこれらを組み合わせたところ,必ずしも実行単位が一致する場合に最も高い認識精度が得られるわけではないことを確認した次に,CMNよりもMVN,短い正規化単位よりも長い正規化単位の方が耐雑音性が高いことを確認した.最後に,正規化単位が移動平均の場合において,△ケプストラムは正規化前の静的ケプストラムから求めるよりも正規化後の静的ケプストラムから求める方が高い認識精度が得られることを確認した.
- 2007-09-01
著者
-
高橋 敏
日本電信電話株式会社,NTTサイバースペース研究所
-
高橋 敏
日本電信電話株式会社 Nttサイバースペース研究所
-
小川 厚徳
日本電信電話株式会社NTTサイバースペース研究所
-
毛呂 良寛
豊橋技術科学大学大学院工学研究科
-
小川 厚徳
日本電信電話株式会社nttサイバースペース研究所:名古屋大学大学院情報科学研究科
-
小川 厚徳
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
関連論文
- 音声デザインツールSesign
- ハイブリッドスケーラブル型音声合成方式
- 単語の文脈一貫性と音響尤度を用いた音声ドキュメント認識信頼度の推定(認識,理解,対話,一般)
- 韻律的特徴と対話的特徴を用いた怒り通話音声の抽出(認識,理解,対話,一般)
- 単語音声認識における音素信頼度ゆう度を用いた未知語のリジェクション
- 話者照合機能を備えた音声秘書システム
- 音素信頼度尤度を用いたリジェクションの高精度化
- 公衆電話音声に対する音声認識性能評価
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 語学訓練のためのHMM音声認識を用いた発声評価尺度
- 部分的尤度分布の差に着目した未知語のリジェクション
- 音響モデルの分布数削減のための混合重み係数を考慮した分布間距離尺度(研究速報)
- ケプストラム正規化の実行単位に関する実験的検証(研究速報)
- コンタクトセンタ向け音声処理技術の展開 (特集 コンタクトセンタ業務に革新をもたらす音声処理技術)
- 学習移動ベクトルの相関関係を用いた音響モデルの話者適応化
- 4階層共有構造の音響モデルによる音声認識
- 音声認識エンジンREXの開発
- 雑音適応におけるTaylor展開の2次微分項の導入による効果
- 離散混合分布型HMMにおける量子化方法の検討
- Jacobian適応法による雑音適応の性能評価
- Jacobi行列を用いた音響モデルの適応アルゴリズム
- 時間非同期ビーム探索に基づく第二パスを用いた連続音声確認(音声処理技術のデモの紹介)
- 日英シームレス音声認識技術による航空路管制音声認識(音声,聴覚)
- 日英シームレス音声認識技術による航空管制音声認識(音声・音響処理)
- 日英シームレス音声認識技術による航空管制音声認識(音声・音響処理)
- 小学生音声データベースを用いた子供音声認識の検討(音声,聴覚)
- D-14-15 日本人英語音声認識における話者適応の検討
- 小学生音声データベースの構築とそれを用いた子供音声認識の一検討
- 小学生音声データベースの構築と評価
- マルチパス探索における第2パス探索法
- 音声認識エンジンVoiceRexによるニュース放送音声認識
- 音声認識エンジンVoiceRexの開発
- 典型的な応対フレーズ検出に基づく高精度用件フェーズ抽出手法(音声・音響一般,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測(音声合成,第13回音声言語シンポジウム)
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測(音声合成,第13回音声言語シンポジウム)
- 単語の文脈一貫性を用いた音声ドキュメント認識信頼度の推定
- 単語の文脈一貫性を用いた音声ドキュメント認識信頼度の推定
- 発話の時間的関係性を用いた対話音声からの怒り感情推定(ヒューマンコミュニケーション基礎,ヒューマンコミュニケーション〜人にやさしい情報通信社会を実現するコミュニケーション技術〜論文)
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測
- テキストからの表現豊かな音声合成のための句末上昇ラベル予測における句末コンテキストの利用
- テキストからの表現豊かな音声合成のための句末上昇ラベル予測における句末コンテキストの利用
- 文脈類似度と認識信頼度に基づく音声認識辞書の自動語彙適応(言語モデル・音声対話)
- 発話の時間的関係性を用いた対話音声からの怒り感情推定