雑音抑圧手法の主観・客観品質と音声認識性能の関係(ポスターセッション)(第6回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
雑音環境下での認識率を推定する一つの方法は,雑音が重畳した音声や雑音抑圧後の音声のひずみ値を算出し,その大きさから推定することである.本稿では,雑音抑圧手法の主観・客観品質と音声認識性能の関係について述べる.まず,雑音が重畳した音声と雑音抑圧後の音声の主観品質評価を行った.その結果,音声のひずみ感が大きいために雑音抑圧手法を適用しても主観品質に改善は見られなかったものの,雑音抑圧手法毎に見ると残留雑音が小さくなるにつれて主観品質も高くなっており,認識性能との対応が良いことを確認した.次に,主観品質と認識性能の関係を調べたところ,主観品質から認識性能を高い精度で推定できることが分かった.また,PESQによる客観品質は主観品質との対応が良いこと,主観品質の場合よりも高い精度で認識性能を推定できることを示した.
- 一般社団法人電子情報通信学会の論文
- 2004-12-14
著者
関連論文
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 楽音と音声の双方に適用できる客観品質推定尺度の検討(ワイヤレス環境でのアプリケーション品質,P2P/アドホックネットワーク,画像符号化ストリーム技術,信頼性,一般)
- IP電話における中国・日本・欧米のMOS評価特性の比較(五感メディア,映像/音声サービスの品質,ネットワークの品質・QoS制御,次世代ネットワークアーキテクチャ,仮想空間におけるユーザコミュニケーション,一般)
- 空間パワースペクトルの主成分分析に基づく時間断続信号の検出 (応用音響)
- B-11-1 IP網における音声の客観品質評価に用いる擬似音声信号の検討(B-11.コミュニケーションクオリティ,一般セッション)
- 空間パワースペクトルの主成分分析に基づく時間断続信号の検出(音響信号処理/聴覚/一般)
- ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(システム論文特集号)
- マイクロホンアレイと音源定位を用いた会議録再生システムについて(立体音響・音場制御/聴覚/一般)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- A-19-8 タッチパネルのための音像定位インタフェースの検討(A-19.福祉情報工学,一般セッション)
- B-11-2 雑音抑圧音声の総合品質推定モデルを適用したフルリファレンス客観品質評価法(B-11.コミュニケーションクオリティ,一般セッション)
- B-11-11 時間離散ひずみの評価を考慮した擬似音声信号の検討(B-11.コミュニケーションクオリティ,一般セッション)
- B-11-12 中国と日本のMOS評価特性の比較(B-11.コミュニケーションクオリティ,一般セッション)
- BS-8-3 雑音抑圧音声の品質推定モデルを用いたノンリファレンス客観品質評価法(BS-8.次世代ネットワークにおける新たなサービス提供を目指したQoS関連技術,シンポジウムセッション)
- BS-8-4 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(BS-8.次世代ネットワークにおける新たなサービス提供を目指したQoS関連技術,シンポジウムセッション)
- D-14-7 ETSI標準雑音抑圧フロントエンドのための雑音推定法の検討(D-14. 音声,一般セッション)
- 雑音抑圧音声の品質推定モデルとそのノンリファレンス客観品質評価への適用(NW管理,次世代NWアーキテクチャ,次世代NWのオペレーションアーキテクチャ,トラヒック計測・モデリング・品質,オーバレイネットワーク,次世代NWサービス品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 装置劣化要因の品質評価に用いるテスト信号の検討(五感メディア,映像/音声サービスの品質,有線無線ネットワークの品質・QoS制御,次世代ネットワークアーキテクチャ,一般)
- 認識対象語彙数を考慮した雑音下孤立単語認識の性能推定(耐雑音性)
- BS-5-4 雑音抑圧音声のMOSと単語了解度の客観推定(BS-5.QoE最前線-情報通信サービスにおけるユーザ体感品質-,シンポジウムセッション)
- HMMとMFCCを用いた楽器音の音源同定の検討
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- B-11-12 QoE評価に用いる標準音声データベースとその特徴量の分析(B-11. コミュニケーションクオリティ,一般セッション)
- BT-1-3 超高速インターネット衛星WINDS「きずな」を用いたアジアの大学との遠隔教育実験(BT-1.新たな衛星利用、衛星応用,チュートリアルセッション,ソサイエティ企画)
- IP電話の通話音質評価(音響配信及び通信における音質変化とその評価)
- 音メディア通信サービスの未来を読む
- IPネットワークサービスを支える音声・音響技術の歴史と発展(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- IPネットワークサービスを支える音声・音響技術の歴史と発展(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- IPネットワークサービスを支える音声・音響技術の歴史と発展(信号処理, 符号化とそれらを用いた知的マルチメディアシステム, 一般)
- B-11-35 平均非対称妨害密度を用いたI_の算出(B-11. コミュニケーションクオリティ, 通信2)
- 音声と非音声の識別処理に基づく定常雑音抑圧方式
- D-14-16 フレーム正規化対数尤度に基づく信頼度を用いた単語レベルの認識結果の統合(D-14. 音声・聴覚, 情報・システム1)
- B-11-19 未知広帯域音声codecの符号化歪み指標Ie,wb算出法に関する一検討(B-11.コミュニケーションクオリティ,一般講演)
- 劣決定音源分離のための分離音声のケプストラムスムージング
- 雑音抑圧処理音声に対する人間の認識率の検討及びPESQを用いた客観推定(ブロードバンドと放送のコンテンツ/セキュリティ/信頼性/モバイル, 及び一般)
- ハンズフリー音声通信のための雑音抑圧手法の主観・客観品質評価
- 雑音抑圧手法の主観・客観品質からの音声認識性能の推定
- 雑音抑圧手法の主観・客観品質と音声認識性能の関係(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音抑圧手法の主観・客観品質と音声認識性能の関係(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音抑圧手法の主観・客観品質と音声認識性能の関係(ポスターセッション)(第6回音声言語シンポジウム)
- モバイル音声通信のための雑音抑圧手法の主観・客観品質評価(モバイルサービス,サービス品質,一般)
- モバイル音声通信のための雑音抑圧手法の主観・客観品質評価(モバイルサービス,サービス品質,一般)
- B-11-18 装置劣化要因を考慮したマルチメディア品質の推定モデル(B-11.コミュニケーションクオリティ,一般講演)
- B-11-7 符号化パラメータを用いたAV通信品質推定のオピニオンモデル(B-11. コミュニケーションクオリティ, 通信2)
- オーディオビジュアル通信における音情報と映像情報の相互関係(モバイル,コンテンツ,セキュリティ,信頼性,一般)
- 周波数依存の時間差モデルによる劣決定BSS
- 周波数依存の時間差モデルによる劣決定BSS
- 球状スピーカアレーを用いた放射特性制御のシミュレーション
- 多チャンネルウィーナーフィルタを用いた音源分離におけるスパースモデルと最小二乗誤差モデルの性能比較
- 高次モーメント分析に基づく非線形MUSICによる劣決定方向推定
- 高次モーメント分析に基づく非線形MUSICによる劣決定方向推定
- 周波数依存到来時間差推定に基づく劣決定ブラインド音源分離の高速化