スペクトルサブトラクションと時間方向スムージングを用いた雑音環境下音声認識
スポンサーリンク
概要
- 論文の詳細を見る
実環境における音声認識の利用においては、雑音による音声認識性能の低下が問題となる。本稿では、雑音への対策法として、スペクトルトラクションと時間方向スムージングを併用する手法(SS-SMT法)を提案する。この手法は、音声と雑音の位相差を考慮してスペクトルサブトラクションを改良するものである。S/N比0dBの自動車走行ノイズ中での10万単語認識実験において、雑音対策をしていないものと比較して27%、一般的なスペクトルサブトラクションと比較して13%の認識率の向上があった。雑音付加学習を併用すると、雑音の分散の影響も考慮に入れることができ、さらに11%認識率が向上した。
- 社団法人電子情報通信学会の論文
- 1998-06-12
著者
関連論文
- カーナビ音声認識の商品開発(パネルディスカッション「音声認識技術の実用化」)
- 音声認識応用に関する学会試行標準
- 統計的特徴量に基づく波形領域の1マイク信号からの信号抽出(音響と音声処理・音声強調,ロバスト音声認識,一般)
- ICAによる信号分解を用いた1マイク信号からの信号抽出
- VoiceXMLをベースにした頑強な音声対話管理アーキテクチャ(自然言語情報処理研究会と一部合同開催 : 自動車内音声対話関連)
- CENSREC-1-C : 雑音下音声区間検出評価基盤の構築
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(ポスターセッション)(第5回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(第5回音声言語シンポジウム : ポスターセッション)
- 地名認識システムとその応用
- 認識結果の正解確率に基づく信頼度のリジェクション(音声情報処理 : 現状と将来技術論文特集)
- スペクトルサブトラクションと時間方向スムージングを用いた雑音環境下音声認識
- 認識結果の正解確率に基づく信頼度とリジェクション
- スペクトルサブトラクションを用いた雑音環境下音声認識における時間方向スムージングと分析窓長増加の効果
- スペクトルサブトラクションを用いた雑音環境下音声認識における時間方向スムージングの効果
- 聞く・喋る・走る車 : DENSO AHS(Automated Highway System)
- 車載機器用音声対話システム
- 統計的特徴量に基づく波形領域の1マイク信号からの信号抽出(音響と音声処理・音声強調,ロバスト音声認識,一般)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 講義音声の認識・要約・インデックス化の検討(要約・分割)
- Trigram・4-gramと文脈依存音響モデルを用いた1パス大語彙連続認識アルゴリズムとその高精度化(認識・理解・対話・一般)
- 誤認識の修復のための自然で効率的な音声対話戦略
- D-14-9 音響特徴を用いた対システム発話と対人間発話の識別(D-14.音声・聴覚,一般講演)
- 発話位置依存CMNとマルチマイクロフォンアレイ処理の併用による遠隔発話の音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 複数の雑音抑圧手法の統合に基づく雑音下音声認識(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(第5回音声言語シンポジウム : ポスターセッション)
- AURORA-2J/AURORA-3Jデータベースとその評価ベースライン
- 雑音下音声認識のための複数の前処理手法の統合とそのAURORA-2Jによる評価
- SLP雑音下音声認識評価のためのWG : 評価データ収集について
- GMMによる雑音抑圧手法選択に基づく雑音下音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- GMMによる雑音抑圧手法選択に基づく雑音下音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- GMMによる雑音抑圧手法選択に基づく雑音下音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 複数の雑音抑圧手法の統合に基づく雑音下音声認識(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 複数の雑音抑圧手法の統合に基づく雑音下音声認識(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 認識結果の正解確率に基づく信頼度とリジェクション
- 認識結果の正解確率に基づく信頼度とリジェクション
- スペクトルサブトラクションと時間方向スムージングを用いた雑音環境下音声認識
- 音源情報の特徴量を用いた音声認識
- スペクトル特徴量と音源特徴量を用いた音声認識用音響モデルとその評価
- 音声認識における音源情報の特徴量に関する検討
- 発話位置依存CMNとマルチマイクロフォンアレイ処理の併用による遠隔発話の音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 発話位置依存CMNとマルチマイクロフォンアレイ処理の併用による遠隔発話の音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 発話位置依存ケプストラム平均正規化による遠隔発話の音声認識と話者認識(一般)
- 発話位置依存ケプストラム平均正規化による遠隔発話の音声認識(認識・理解・対話)
- 発話位置依存ケプストラム平均正規化による遠隔発話の音声認識(認識・理解・対話)
- 孤立単語認識と連続基本単語認識の併用に基づく組織名の音声入力インタフェース(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 孤立単語認識と連続基本単語認識の併用に基づく組織名の音声入力インタフェース(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 孤立単語認識と連続基本単語認識の併用に基づく組織名の音声入力インタフェース(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 高頻度組織名と基本単語を用いた任意組織名入力インタフェース
- 音声対話システムにおける否定表現の検出
- 対話システムにおける言い直し・否定表現に着目した訂正発話の検出
- 音声対話システムの誤認識に対するユーザの繰返し訂正発話の検出と認識(音声,聴覚)
- N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識(音声,聴覚)
- N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識(認識・理解・対話)
- 連続音声認識システムSPOJUSの改善
- 音節N-gramと単語辞書併用による姓名入力インタフェース(第5回音声言語シンポジウム : ポスターセッション)
- 音節N-gramと単語辞書併用による姓名入力インタフェース(第5回音声言語シンポジウム : ポスターセッション)
- 音節N-gramと単語辞書併用による姓名入力インタフェース
- ウェブブラウザにおける任意文字列入力を目的とした音声入力インタフェース
- 言語的・音響的コンテキストが講演音声の聴取および認識に及ぼす効果(認識・理解・対話)
- 前後のコンテキストが講演音声の聴取および認識に及ぼす効果
- 韻律・表層的言語情報を発話タイミング制御に用いた雑談対話システム
- 韻律・言語情報を素性とした決定木による自然な応答生成タイミングの検出
- 対話音声中の言い直し発話の検出と認識(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話2)
- 対話音声中の言い直し発話の検出と認識
- 対話音声中の言い直し発話の検出
- カーナビの地名音声入力における誤認識時の言い直し発話の検出と認識
- 音声による地名入力タスクにおける誤認識時の言い直し発話の検出と認識
- カーナビの地名入力における誤認識時の言い直し発話の検出手法
- カーナビの地名入力における誤認識時の訂正発話の分析と検出