小規模マイクロホンアレーを用いた車室内音声認識のための雑音除去(音声,聴覚)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では2チャネルの小規模マイクロホンアレーを用いた音声認識のための雑音除去手法について述べる.音声認識を車載機器へ適用することを考えた場合,ユーザーである運転手の位置はあらかじめ想定可能である.また車室内で発生する騒音の多くは拡散性雑音である.本論文では以上の条件と低演算量で安定して動作することを重視し,あらかじめ話者位置の変動を考慮し設計した固定ビームフォーマを提案する.またスペクトルサブトラクション法の後処理として,非フロアリング成分の密集度に基づくミュージカルノイズ削減処理,主副ビームフォーマの帯域制限パワー差に基づくスペクトル置き換え処理を提案する.評価実験を行い,これらの手法による音声認識性能の改善を確認した.またDSP上へ提案アルゴリズムの実装を行い低演算量で動作することを確認した.
- 2013-11-01
著者
関連論文
- カーナビゲーション向け音声認識の新たな展開 (特集 次世代の車づくりに貢献する先進技術)
- 拡散音場理論に基づく残響環境下音声認識 (信号処理)
- 拡散音場理論に基づく残響環境下音声認識 (応用音響)
- D-14-16 音素脱落を許す単語モデルを用いた日本人英語の認識
- VQ写像を用いた2入力SSによる非定常騒音下の音声認識
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- D-14-8 車室内における音声認識向け騒音抑圧手法の比較(D-14. 音声,一般セッション)
- D-14-13 音響モデルの正規化パワーを考慮した騒音下音声認識の検討(D-14. 音声・聴覚, 情報・システム1)
- D-14-13 学習データ量の年代別偏りを考慮した音響モデル構築方式の検討(D-14. 音声・聴覚)
- D-14-12 車室内で発生する規則性非定常騒音下での音声認識
- VQ写像を用いた2入力SSによる非定常騒音下音声認識の検討 - 自動車内走行騒音への適用 -
- D-14-21 音声認識における特徴ベクトルの補間及びフレーム間引き手法の検討
- D-14-10 N-gram言語モデルを用いた音声対話システムにおける冗長語処理の検討
- タスクの例文を用いた自由発話音声認識のための言語モデルの構築
- SD-3-3 N-gramモデルを用いた音声対話システムのための音声認識の検討
- D-14-20 音声対話システムにおける少量テキストを用いた言語モデルのタスク適応に関する検討
- 自由発話音声認識のためのトライ音節モデルの検討
- 音声対話システムにおける教師なし話者適応の検討
- 音声対話システムにおける湧き出し誤りのリジェクト方式の検討
- 認識結果の信頼度を考慮した教師無し話者適応方式の検討
- D-14-7 符号化データを用いた音声認識方式の検討
- D-14-4 連続音声認識における音節継続時間情報を用いた演算量削減(D-14.音声・聴覚,一般講演)
- D-14-6 統計言語モデルを用いた連続音声認識における単語グループ間バイグラムの削減(D-14.音声・聴覚,一般講演)
- 音声認識技術
- 音声認識技術とその応用 (特集 IT時代のヒューマンインタフェース技術)
- ピッチパタンの統計モデルに基づく句境界情報を利用した文節スポッティング
- 単語リジェクト方式のキーワードスポッティングによる評価
- D-14-7 必須形態素の検証によるテキスト検索の改善(D-14.音声,一般セッション)
- 拡散音場理論に基づく残響環境下音声認識
- 拡散音場理論に基づく残響環境下音声認識
- 小規模マイクロホンアレーを用いた音声認識のための雑音除去(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- D-9-34 単語間の連接情報を用いた階層入力方式(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
- A-11-1 超音波センサの指向性と強度比を利用した開口合成画像からの虚像除去(A-11.超音波,一般セッション)
- 音声と騒音の密度比推定を用いた音声区間検出法(音声入力・区間検出,認識,理解,対話,一般)
- 小規模マイクロホンアレーを用いた車室内音声認識のための雑音除去(音声,聴覚)
- D-12-1 領域内の最適化に基づく文字列抽出手法(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成))
- D-12-2 文字認識処理におけるガベージデータを考慮した特徴次元圧縮法(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成))
- D-14-6 発話スイッチレス音声認識のためのサブワード言語モデルによる尤度検証(D-14.音声)
- D-14-5 外耳道孔装着マイクを用いた音声認識(D-14.音声)
- A-10-1 騒音中の異音検出におけるスペクトログラム統計量の比較(A-10.応用音響)
- A-4-6 2値マスクと独立ベクトル分析を併用したセミブラインド音源分離(A-4.信号処理,一般セッション)