パワートラジェクトリー上での残響のモデル化と遠隔音声認識への適用(聴覚・音声及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
遠隔音声認識で問題となる残響の影響を低減するため, MFCC分析におけるメルBPF出力パワートラジェクトリー上での残響のモデル化を検討している.この残響モデルは, 残響を表す指数的減衰係数, 直接音対残響音比, 初期反射によるカラーリング含むチャンネルゲインの3つのパラメータから成り立っている.モデルパラメータは, 残響有り無しの一対の学習音声を用いて対数パワートラジェクトリー上での誤差最小基準により推定される.指定パラメータを用いて残響パワートラジェクトリーを合成し, それから得られるMFCCを用いてHMMを学習した結果, 実残響音声で学習したHMMによる認識精度との差は数%以内であった.更に, このモデルに基づく逆フィルタとフロアリング及び平滑化の後処理より, 日本語数字音声の認識において単語正解精度を最大12
- 社団法人電子情報通信学会の論文
- 2005-07-15
著者
関連論文
- 仮名文字と連語登録を併用した統計的言語モデル
- 大規模コーパスにおける連語登録法
- 音節連鎖モデルによる大語彙連続音声認識(ポスターセッション)(第5回音声言語シンポジウム)
- 音節連鎖モデルによる大語彙連続音声認識(第5回音声言語シンポジウム : ポスターセッション)
- 音節連鎖モデルによる大語彙連続音声認識(第5回音声言語シンポジウム : ポスターセッション)
- 音声認識における音節連鎖モデルの検討
- 成人の読上げ音声における声質評価値と音響関連量の分析的検討
- パワートラジェクトリー残響モデルに基づく残響の低減と音声認識による評価(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- メルLPC分析に基づく音声認識フロントエンドのCENSRECによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- パワートラジェクトリー残響モデルに基づく残響の低減と音声認識による評価(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- メルLPC分析に基づく音声認識フロントエンドのCENSRECによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- パワートラジェクトリー残響モデルに基づく残響の低減と音声認識による評価(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- メルLPC分析に基づく音声認識フロントエンドのCENSRECによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- [若手研究者育成レクチャーシリーズ]環境変動にロバストな音声認識(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- [若手研究者育成レクチャーシリーズ]環境変動にロバストな音声認識(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- [若手研究者育成レクチャーシリーズ]環境変動にロバストな音声認識(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- パワートラジェクトリー上での残響のモデル化と遠隔音声認識への適用(聴覚・音声及び一般)
- メルLPC分析に基づく音声認識のためのメルウイナーフィルタの改良(聴覚・音声及び一般)
- パワートラジェクトリー上での残響のモデル化と遠隔音声認識への適用
- 一般化動的ケプストラムを用いた音声認識フロントエンドの耐雑音性の改良
- 一般化動的ケプストラムに用いたフロントエンドの対雑音性の改良
- メルLPC分析に基づく音声認識への聴覚特性の導入
- 動的個人性に関する声質評価値と音響的関連量の検討
- SVD法による重回帰話者適応化法の改良
- 残響付加音声に対する動的ケプストラムの最適化
- SVD法を用いた重回帰話者適応
- 声質評価値と音響パラメータの間の分析的検討
- SVD 法に基づく重回帰話者適応の大語彙連続音声認識による評価
- 大語彙連続音声認識における音節モデルの改良
- 動的一般化ケプストラムによるハンズフリー音声認識の検討
- 大語彙連続音声認識によるメルLPC分析の評価
- 大語彙連続音声認識によるメルLPC分析の評価
- 声質評価値と音響パラメータとの関連の検討-第2報
- 一般化対数関数目盛上のフォワードマスキングによる耐環境性の改善
- 2次項を含む重回帰話者適応の検討
- 声質評価値と音響パラメータとの関連の検討
- メルLPC分析の日本語ディクテーションシステムによる評価
- ノルム最小化重回帰写像による話者適応
- 音声認識における環境適応技術
- HMM合成における分散制御に関する検討
- 低認識率話者の音響的要因に関する検討
- 音声の動的個人性に関する主観評価の試み
- オーディオ符号化におけるMDCT係数の削減
- 分散拡大による変動雑音に頑健なHMM合成法の改良
- メルLPCケプストラムの耐雑音性の評価
- 分散拡大による変動雑音にロバストなHMMに関する検討
- 音声認識におけるメルLPCケプストラムの評価
- 音声認識におけるメル線形予測分析法の評価
- オーディオ符号化におけるスペクトル包絡推定法の改良
- 音声認識におけるSNRを考慮した伝送歪みの補償法
- 差分ベクトル間の相関を考慮した木構造確率分布による話者適応
- スペクトル補償と周波数重み付けHMMによる雑音下の音声認識
- 周波数重み付けHMMとスペクトルサブトラクションによる雑音下の音声認識
- 制限付き重回帰モデルと最大事後確率推定法を用いた話者適応
- 区分化に木構造を用いた制限付き重回帰モデルによる話者適応
- 差分ベクトルの木構造結びに成分分布の信頼度を考慮した話者適応
- 成分分布データ量を考慮した差分スペクトル補間による話者適応
- 誤り最小基準による混合分布型周波数重み付けHMMの学習
- 誤り最小基準による周波数重み付けHMMの学習
- 制限付き重回帰モデルによる話者適応の検討
- セグメント単位入力HMMによる雑音環境下での音声認識
- 発話スタイルによる話速・音韻間距離・ゆう度の違いと音声認識性能の関係(音声情報処理 : 現状と将来技術論文特集)
- SP2000-18 発話間のVQ歪みを用いたオンライン話者交替識別と話者クラスタリング
- コンパクトで高精度な音節モデルの検討
- 音韻認識における連続分布型HMMの教師なし話者適応 (応用音響に関する特集)
- ベクトル量子化誤差の区分平均化による教師なし話者適応
- 音声認識における環境適応技術
- 音声認識における環境適応技術
- 周波数重み付けによる混合連続分布型HMMの耐雑音性の改善
- スペクトルサブトラクション法における低SNR部のスペクトル補間に関する検討
- スペクトル系列の生成による混合連続分布型HMMの雑音への適応
- 音声認識における話者適応
- 教師あり/教師なしスペクトル写像による声質変換
- 雑音下音声認識における周波数重み付けHMMの改良と評価
- 単語認識における重み付き群遅延距離尺度の耐雑音・耐話者性 - 各種尺度との比較評価 -
- 雑音下音声認識のための重み付け群遅延スペクトル距離尺度