音声認識におけるメル線形予測分析法の評価
スポンサーリンク
概要
- 論文の詳細を見る
Strubeによって提案されたバークあるいはメルスケール上の線形予測分析は、人間の聴覚特性を用いたMFCCやPLP分析と同様に音声認識に有効であると期待される。しかし、この方法は通常の線形予測分析と比較して計算量が多く、音声認識にほとんど使用されていない。本報告では、メル化された予測係数を時間領域で効率的に推定するための分析手法(メル線形予測分析:MLPC分析)を提案する。本手法は、通常の線形予測分析の約2倍の計算量で実現できる。MLPC分析により得られるメルケプストラム(MLPCケプストラム)と通常のLPCメルケプストラムとを男性不特定話者音声認識実験を通して比較した。その結果、MLPCケプストラムの方はLPCメルケプストラムよりも音素認識率で約8.6%高い73.4%の認識率を、また単語認識率(520単語)で約3.3%高い96.0%の認識率を示した。
- 社団法人電子情報通信学会の論文
- 1998-06-11
著者
関連論文
- 仮名文字と連語登録を併用した統計的言語モデル
- 大規模コーパスにおける連語登録法
- 音節連鎖モデルによる大語彙連続音声認識(ポスターセッション)(第5回音声言語シンポジウム)
- 音節連鎖モデルによる大語彙連続音声認識(第5回音声言語シンポジウム : ポスターセッション)
- 音節連鎖モデルによる大語彙連続音声認識(第5回音声言語シンポジウム : ポスターセッション)
- 音声認識における音節連鎖モデルの検討
- 成人の読上げ音声における声質評価値と音響関連量の分析的検討
- パワートラジェクトリー残響モデルに基づく残響の低減と音声認識による評価(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- メルLPC分析に基づく音声認識フロントエンドのCENSRECによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- パワートラジェクトリー残響モデルに基づく残響の低減と音声認識による評価(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- メルLPC分析に基づく音声認識フロントエンドのCENSRECによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- パワートラジェクトリー残響モデルに基づく残響の低減と音声認識による評価(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- メルLPC分析に基づく音声認識フロントエンドのCENSRECによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- [若手研究者育成レクチャーシリーズ]環境変動にロバストな音声認識(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- [若手研究者育成レクチャーシリーズ]環境変動にロバストな音声認識(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- [若手研究者育成レクチャーシリーズ]環境変動にロバストな音声認識(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- パワートラジェクトリー上での残響のモデル化と遠隔音声認識への適用(聴覚・音声及び一般)
- メルLPC分析に基づく音声認識のためのメルウイナーフィルタの改良(聴覚・音声及び一般)
- パワートラジェクトリー上での残響のモデル化と遠隔音声認識への適用
- 一般化動的ケプストラムを用いた音声認識フロントエンドの耐雑音性の改良
- 一般化動的ケプストラムに用いたフロントエンドの対雑音性の改良
- メルLPC分析に基づく音声認識への聴覚特性の導入
- 動的個人性に関する声質評価値と音響的関連量の検討
- SVD法による重回帰話者適応化法の改良
- 残響付加音声に対する動的ケプストラムの最適化
- SVD法を用いた重回帰話者適応
- 声質評価値と音響パラメータの間の分析的検討
- SVD 法に基づく重回帰話者適応の大語彙連続音声認識による評価
- 大語彙連続音声認識における音節モデルの改良
- 動的一般化ケプストラムによるハンズフリー音声認識の検討
- 大語彙連続音声認識によるメルLPC分析の評価
- 大語彙連続音声認識によるメルLPC分析の評価
- 声質評価値と音響パラメータとの関連の検討-第2報
- 一般化対数関数目盛上のフォワードマスキングによる耐環境性の改善
- 2次項を含む重回帰話者適応の検討
- 声質評価値と音響パラメータとの関連の検討
- メルLPC分析の日本語ディクテーションシステムによる評価
- ノルム最小化重回帰写像による話者適応
- 音声認識における環境適応技術
- HMM合成における分散制御に関する検討
- 低認識率話者の音響的要因に関する検討
- 音声の動的個人性に関する主観評価の試み
- オーディオ符号化におけるMDCT係数の削減
- 分散拡大による変動雑音に頑健なHMM合成法の改良
- メルLPCケプストラムの耐雑音性の評価
- 分散拡大による変動雑音にロバストなHMMに関する検討
- 音声認識におけるメルLPCケプストラムの評価
- 音声認識におけるメル線形予測分析法の評価
- オーディオ符号化におけるスペクトル包絡推定法の改良
- 音声認識におけるSNRを考慮した伝送歪みの補償法
- 差分ベクトル間の相関を考慮した木構造確率分布による話者適応
- スペクトル補償と周波数重み付けHMMによる雑音下の音声認識
- 周波数重み付けHMMとスペクトルサブトラクションによる雑音下の音声認識
- 制限付き重回帰モデルと最大事後確率推定法を用いた話者適応
- 区分化に木構造を用いた制限付き重回帰モデルによる話者適応
- 差分ベクトルの木構造結びに成分分布の信頼度を考慮した話者適応
- 成分分布データ量を考慮した差分スペクトル補間による話者適応
- 誤り最小基準による混合分布型周波数重み付けHMMの学習
- 誤り最小基準による周波数重み付けHMMの学習
- 制限付き重回帰モデルによる話者適応の検討
- 応答文の切り替えがもたらすタスク達成時間短縮効果についての検討
- スペクトル線形写像による帯域制限音声の広帯域化(音声情報処理 : 現状と将来技術論文特集)
- 線形写像による帯域制限音声の疑似広帯域化
- 線形写像による帯域制限音声の疑似広帯域化
- 帯域制限された音声における広帯域化法の比較
- 帯域拡大による広帯域音声の合成方法の検討
- 音韻認識における連続分布型HMMの教師なし話者適応 (応用音響に関する特集)
- TV会議用話者自動検出装置の開発
- ベクトル量子化誤差の区分平均化による教師なし話者適応
- 対数パワースペクトル領域での減算処理による乗法性歪みの除去
- 周波数伸縮を用いた話者正規化法の種々の年齢層話者に対する検討
- 音声認識における環境適応技術
- 音声認識における環境適応技術
- 周波数重み付けによる混合連続分布型HMMの耐雑音性の改善
- スペクトルサブトラクション法における低SNR部のスペクトル補間に関する検討
- スペクトル系列の生成による混合連続分布型HMMの雑音への適応
- 音声認識における話者適応
- 教師あり/教師なしスペクトル写像による声質変換
- 雑音下音声認識における周波数重み付けHMMの改良と評価
- 単語認識における重み付き群遅延距離尺度の耐雑音・耐話者性 - 各種尺度との比較評価 -
- 雑音下音声認識のための重み付け群遅延スペクトル距離尺度