騒音環境下音声認識に対する識別的アプローチの有効性 : 第2回CHiMEチャレンジ(雑音対策,認識,理解,対話,一般)
スポンサーリンク
概要
- 論文の詳細を見る
第2回CHiMEチャレンジは,非定常の妨害音を伴う2マイクロフォンでの困難な音声認識タスクである.我々は識別学習や様々な特徴量変換,ディープニューラルネットといった先端的な音声認識の手法の残響・騒音音声認識に対する有効性を検証した.騒音抑圧には音源到来方向を推定し,事前分布を用いてバイナリマスクを行うシンプルな方法を用いた.さらに任意の特徴量を識別的特徴量変換に導入可能な拡張識別的特徴量変換,識別的言語モデリングとベイズリスク最小化デコーディングを音声認識の後段で効率的に統合する手法を提案した.これらはCHiMEチャレンジのTrack2である中程度の語彙タスクに有効であり,参加者中最も高い性能を獲得した.
- 一般社団法人電子情報通信学会の論文
- 2013-07-18
著者
-
太刀岡 勇気
三菱電機株式会社情報技術総合研究所
-
渡部 晋治
Mitsubishi Electric Research Laboratories
-
ルルー ジョナトン
Mitsubishi Electric Research Laboratories
-
ハーシー ジョン
Mitsubishi Electric Research Laboratories
関連論文
- 拡散音場理論に基づく残響環境下音声認識 (信号処理)
- 拡散音場理論に基づく残響環境下音声認識 (応用音響)
- 40121 局所作用を仮定した垂直入射吸音率と残響室法吸音率の関係 : FDTD法による残響室の数値解析(音場解析(2),環境工学I)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- CIP法による時間領域音場解析に関する研究(優秀修士論文賞推薦理由,2008年日本建築学会優秀卒業論文賞・日本建築学会優秀修士論文賞)
- 拡散音場理論に基づく残響環境下音声認識
- 拡散音場理論に基づく残響環境下音声認識
- 音声と騒音の密度比推定を用いた音声区間検出法 (音声)
- A-11-1 超音波センサの指向性と強度比を利用した開口合成画像からの虚像除去(A-11.超音波,一般セッション)
- 階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング(ベイズ統計モデル,統計推理,データベース,一般)
- 音声と騒音の密度比推定を用いた音声区間検出法(音声入力・区間検出,認識,理解,対話,一般)
- 騒音環境下音声認識に対する識別的アプローチの有効性 : 第2回CHiMEチャレンジ(雑音対策,認識,理解,対話,一般)
- 階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング
- A-4-6 2値マスクと独立ベクトル分析を併用したセミブラインド音源分離(A-4.信号処理,一般セッション)