時間周波数マスキング特性を模擬した聴覚フィルタモデルによる音声認識
スポンサーリンク
概要
- 論文の詳細を見る
本論文では内耳基底膜におけるフィルタリング機構を模擬する蝸牛フィルタの出力に対し、聴覚心理学的に重要な時間周波数マスキング特性を導入した聴覚フィルタモデルによる音声スペクトル表現法を提案し、その有効性を検討した結果について報告する。聴覚系での順向マスキングパターンはマスカと信号音の時間間隔が長くなるに従って減少すると共に周波数方向に拡がる。この時間周波数マスキングには音声スペクトルに共通に含まれる個人性などに起因する音声スペクトルの傾斜を軽減し、音韻知覚上重要なスペクトルピークの動的な特徴を強調する動きがある。本論文では、順向マスキング機構をモデル化し、蝸牛フィルタに付随する特徴抽出機構として導入することにより聴覚フィルタモデルの精密化を図った。提案した聴覚フィルタモデルを多数話者単語音声認識及び雑音環境下単語音声におけるフロントエンドとして用いて評価を行った結果、多数話者単語音声認識において5%、S/N10dBの雑音環境下単語音声認識において15%の認識率の向上が認められ、提案した聴覚フィルタモデルに基づく音声スペクトル表現法の有効性が確認された。
- 社団法人日本音響学会の論文
- 1994-05-01
著者
関連論文
- 音源構造抽出法の初期推定値のバイアス除去と高速化について
- 単語の音節遷移情報の処理を担う脳領域のfMRIによる検討
- 連続母音の遷移部の知覚における後続雑音の効果
- 周波数変化音追跡モデルに基づくスペクトル予測法
- 種々の周波数変化音の動的知覚特性
- 周波数変化音追跡モデルに基づく知覚スペクトル予測法
- 周波数変化音の動的知覚特性
- 音声認識のための新しい音声分析
- スイープ音追跡過程の動特性
- 連続音声の過度部の知覚における後続雑音の効果
- 音の立ち上がりによる時間周波数マスキングの制御
- 周波数変化音知覚における残効
- 各種時間周波数マスキングフィルタを用いた耐雑音性連続音声認識
- 動的ケプストラムを用いた音声認識におけるバースト性雑音に対する耐性の検討
- 動的ケプストラムを用いた音声認識における耐雑音性評価
- ニューラルネットによる時間周波数マスキングフィルタの最適化
- 複合周波数変化音追跡神経演算モデル
- 周波数変化音追跡神経回路モデル
- 周波数変化音追跡神経回路モデル
- 時間周波数マスキング特性を模擬した聴覚フィルタモデルによる音声認識
- 順向マスキングの時間周波数特性を模擬した動的ケプストラムを用いた音韻認識
- DTW単語認識システムにおける聴覚フィルタフロントエンドの評価
- ピッチ変換聴覚フィードバックの喉頭筋制御への影響について
- 10.視聴覚技術(テレビジョン年報)
- 音声の基本周波数揺らぎの発生源と聴覚による変形について
- 音声の基本周波数の揺らぎに対する聴覚フィードバックの寄与について
- 音声分析変換合成系における時変フィルタの実装と駆動情報の表現について
- 音声分析・変換・合成法STRAIGHTのスペクトル近似特性の評価と改良について
- バートレット窓特性を用いたスペクトル補間による信号分離方法の一考察
- 時間周波数領域での補間を用いた音声の変換について
- 原理的に抽出誤りの存在しないピッチ抽出方法とその評価について
- STRAIGHT分析合成音声を用いた/r/-/1/音聴取訓練
- 周波数変化音追跡の動特性
- 音声基本周波数の揺らぎに対する聴覚フィードバック条件の影響について
- 会話音声と歌唱音声の基本周波数制御の動特性について(音楽音響信号認識/生成2)
- 自然性の極めて高い音声分析変換合成法(音声研究の新しい手法)
- 変換聴覚フィードバックを用いたピッチ変動の影響の解析