スペクトル減算と振幅抑圧の相互制御に基づく雑音抑圧法の検討(音声,聴覚)
スポンサーリンク
概要
- 論文の詳細を見る
3GPP(The 3rd Generation Partnership Project)標準音声コーデックAMR(Adaptive Multi-Rate)に適用するノイズサプレッサについて述べる.3GPPノイズサプレッサ要求性能基準(TS 26.077)では,限られた演算量で高品質と高い雑音抑圧能力が両立することが求められている.本論文では,スペクトルサブトラクション法をベースとし,スペクトル減算と振幅抑圧を入力信号の状態に応じて相互制御する構成並びに,スペクトル減算と振幅抑圧の制御に用いるサブバンドS/N(信号対雑音比)の改良推定法について検討する.本方式に対してシミュレーション実験による評価を行った結果,その有効性を確認した.また,3GPP TS 26.077に準拠する主観評価試験(第三者評価)及び客観評価試験を実施した結果,3GPP要求性能基準をすべてクリアし,2002年5月に3GPPから初の性能承認(Endorsement)を得た.
- 社団法人電子情報通信学会の論文
- 2004-02-01
著者
-
中島 邦男
三菱電機株式会社情報技術総合研究所:(現)横浜国立大学産学連携推進本部
-
中島 邦男
三菱電機株式会社情報技術総合研究所
-
高橋 真哉
三菱電機株式会社情報技術総合研究所
-
高橋 真哉
三菱電機(株) 情報技術総合研究所
-
古田 訓
三菱電機(株)情報技術総合研究所
-
古田 訓
三菱電機株式会社情報技術総合研究所
-
古田 訓
三菱電機株式会社 情報技術総合研究所
関連論文
- D-14-10 音声認識におけるリジェクトのためのスコア正規化方法の検討(D-14. 音声・聴覚)
- D-14-16 音素脱落を許す単語モデルを用いた日本人英語の認識
- VQ写像を用いた2入力SSによる非定常騒音下の音声認識
- 日本人英語認識におけるマルチ単語モデルの改良
- 複数単語モデルによる日本人英語音声認識の検討
- 日本人英語の発話様態を考慮した英語音声連続認識の検討
- 発声変形モデルを用いた騒音環境下音声認識
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- B-8-22 対向通話のモニター機能を備える音声通信システムの検討
- CELPの聴覚的劣化感を低減する音源符号帳探索方式の検討(音声,聴覚)
- D-14-25 音声様態に基づく重み付き歪みによるCELP音源探索
- 聴覚的な劣化感を低減する CELP 音源探索方式の提案
- 代数符号帳サブセットの符号化特性評価
- マルチモード音声符号化における通信路誤り耐性の改善
- D-14-10 LSP補正に基づく低レート音声符号化方式の品質改善
- D-14-7 適応/固定音源のピーク性に基づく雑音符号帳切り替えの検討
- ピッチ位置同期CELPの音源符号化方式の改良
- CS-ACELP可変レート化の一検討
- ピッチ位置同期CELPの音源符号化方式の検討
- ピッチ位置同期CELPの誤り耐性改善の検討
- 位相符号化CELP(PC-CELP)の改良検討
- 低ビットレ-ト音声符号化技術 (ディジタル自動車電話) -- (ディジタル自動車電話を支える技術)
- テキスト音声合成における統計的言語情報を利用した基本周波数制御
- 電話の相手はコンピュータ? : 電話系音声認識とその応用
- 統計的言語特徴を利用したテキスト音声合成の韻律制御
- テキスト音声合成における統計的言語情報を利用したポーズ予測
- テキスト音声合成における統計的言語情報を利用した韻律制御
- テキスト音声合成における統計的言語特徴を利用した韻律制御B30641999090133TITE Prosodic Control for Text-Speech system Using Statistical Language Features
- テキスト音声合成におけるピッチ制御と言語情報
- 韻律を考慮した音声素片を用いる日本語テキスト音声合成
- 韻律を考慮した規則合成の音声素片
- 対話文脈を利用した概念素に基づく音声理解
- D-14-13 学習データ量の年代別偏りを考慮した音響モデル構築方式の検討(D-14. 音声・聴覚)
- D-14-12 車室内で発生する規則性非定常騒音下での音声認識
- VQ写像を用いた2入力SSによる非定常騒音下音声認識の検討 - 自動車内走行騒音への適用 -
- D-14-21 音声認識における特徴ベクトルの補間及びフレーム間引き手法の検討
- D-14-10 N-gram言語モデルを用いた音声対話システムにおける冗長語処理の検討
- SD-3-3 N-gramモデルを用いた音声対話システムのための音声認識の検討
- D-14-20 音声対話システムにおける少量テキストを用いた言語モデルのタスク適応に関する検討
- 自由発話音声認識のためのトライ音節モデルの検討
- 音声対話システムにおける教師なし話者適応の検討
- 音声対話システムにおける湧き出し誤りのリジェクト方式の検討
- 認識結果の信頼度を考慮した教師無し話者適応方式の検討
- 少数話者音声データによる不特定話者モデルのタスク適応
- 位取り用語を含んだ連続数字音声認識の検討
- 規則合成のための波形データの圧縮法
- 大語彙連続音声認識のための複数言語モデルの並列同時単語列探索法(音声言語)(次世代移動体通信システム)
- 話題混合言語モデル構築のための単語連鎖統計量を用いたコーパス分類尺度
- 単語とサブワードの統計量を用いた言語モデル構築手法の一検討
- 混合言語モデルのためのコーパスの記事単位クラスタリング
- 音節認識結果における誤り傾向を考慮した未知語学習の評価
- D-14-9 スムージングを考慮したMDI法の一検討
- D-14-7 符号化データを用いた音声認識方式の検討
- 混合言語モデルのための並行単語列検索
- クラス情報を用いた単語トライグラム言語モデルの一検討
- 分野外の統計量を用いた言語モデルの一検討
- 混合言語モデル作成のためのコーパスのクラスタ分割の検討
- 住所認識のための部分辞書選択法の検討
- スペクトル減算と振幅抑圧の相互制御に基づく雑音抑圧法の検討(音声,聴覚)
- 日本語規則合成のための2モーラを単位とする音韻継続時間長規則
- 規則合成における2音節を単位とする音韻継続時間長制御
- 韻律を考慮した規則合成単位の評価
- 韻律を考慮した音声素片を用いる規則合成
- 韻律を考慮した音声素片を用いる規則合成方式
- ピッチパタンの統計モデルに基づく句境界情報を利用した文節スポッティング
- 単語リジェクト方式のキーワードスポッティングによる評価
- 認識誤り傾向の確率モデルを用いた2段階探索法による大語彙連続音声認識
- ローカルな発話速度が音節認識性能に与える影響について
- クラスタリング情報を用いた未知バイグラム確率推定の一検討
- トピック分割による統計量を用いた言語モデルの一検討
- 大語彙連続音声認識のための音節認識における声道・音源特徴併用の検討
- 音節認識結果における誤り傾向を考慮した未知語学習の一方式
- 手動および自動クラスタリングによる言語モデルの比較
- 二段階探索法による連続音声認識におけるNベスト音節認識結果使用の検討
- 認識誤り傾向の確率モデルを用いた二段階探索法による大語彙連続音声認識
- 少量コーパスにおけるクラス言語モデルの一検討
- 最大分岐密度選択法の音声認識への適用
- 文字連鎖統計量を用いた未知語モデルによる単語推定
- 予備選択における性能向上の一検討
- 1段目の最適解と正解との差分傾向を考慮した2段階探索法
- ユーザの行動目標に基づく対話管理手法
- 音声認識における継続時間長制御の高精度化の検討
- データベース検索のための大語彙音声認識方式の検討
- 文節スポッティングにおける未知語検出方式の改良
- 自由発話音声における音韻の変形傾向を考慮した音響モデル構成法の検討
- 文節スポッティングにおける未知語処理方式の検討
- 意味主導型音声理解システムのための文節スポッティングの改良
- 住所認識のための辞書分割法の検討
- 概念素理解方式の一般化とタスク知識の適用手法
- 概念素に基づく意味理解における言語知識の詳細化
- 概念素に基づく意味理解の文の表現性の拡張
- 概念素に基づく意味理解における音声認識への統合手法
- 概念素探索法における概念素仮説からの文意統合方式
- テキスト音声認識におけるインクリメンタル適応型ビームサーチの検討
- 姓名認識のための音節ネットワーク構成法の検討
- 音響形態素を単位としたテキスト音声認識の検討
- 音節グラフの文脈自由構文解析におけるA^*探索の検討
- 分野非限定の大語い連続音声認識における音響言語探索手法の検討
- 分野非限定の大語い連続音声認識における音響言語結合方式の検討
- 線形音素文脈モデルを用いた音声認識方法 (新しい音声処理技術特集)