拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
残響環境下での音声認識性能向上のための残響除去法を提案する.本方式はスペクトルサブトラクション(SS)法により残響を除去する.その際のSS法の引き去り係数は,拡散音場理論に基づき残響時間から算出する.残響時間を発話から推定することで,事前知識なくさまざまな残響環境においてロバストに残響除去を行うことができる.JEIDA-JCSD(B-set)の音声とIPSJSIG-SLP残響下音声認識評価環境CENSREC-4を用いた音声認識実験により提案法の有効性を示す.
- 2010-05-19
著者
-
花沢 利行
三菱電機(株)情報技術総合研究所
-
岩崎 知弘
三菱電機(株)情報技術総合研究所
-
太刀岡 勇気
三菱電機株式会社情報技術総合研究所
-
花沢 利行
三菱電機株式会社情報技術総合研究所
-
岩崎 知弘
三菱電機株式会社情報技術総合研究所
-
岩崎 知弘
三菱電機株式会社 情報技術総合研究所
-
太刀岡 勇気
東京大学
関連論文
- カーナビゲーション向け音声認識の新たな展開 (特集 次世代の車づくりに貢献する先進技術)
- 拡散音場理論に基づく残響環境下音声認識 (信号処理)
- 拡散音場理論に基づく残響環境下音声認識 (応用音響)
- D-14-10 音声認識におけるリジェクトのためのスコア正規化方法の検討(D-14. 音声・聴覚)
- D-14-16 音素脱落を許す単語モデルを用いた日本人英語の認識
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- 40121 局所作用を仮定した垂直入射吸音率と残響室法吸音率の関係 : FDTD法による残響室の数値解析(音場解析(2),環境工学I)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- HMM-LR音声認識システムの性能評価
- Hidden Markov モデルによる日本語有声破裂音の認識
- 電話の相手はコンピュータ? : 電話系音声認識とその応用
- A-10-4 ステレオ音楽音響信号からのボーカルピッチ抽出の検討(A-10.応用音響,一般セッション)
- D-14-9 並列整合モデルによる雑音環境下音声認識におけるモデル選択の検討(D-14. 音声,一般セッション)
- 住所認識のためのメモリ管理方式の検討
- CIP法による時間領域音場解析に関する研究(優秀修士論文賞推薦理由,2008年日本建築学会優秀卒業論文賞・日本建築学会優秀修士論文賞)
- D-14-8 車室内における音声認識向け騒音抑圧手法の比較(D-14. 音声,一般セッション)
- D-14-13 音響モデルの正規化パワーを考慮した騒音下音声認識の検討(D-14. 音声・聴覚, 情報・システム1)
- D-14-13 学習データ量の年代別偏りを考慮した音響モデル構築方式の検討(D-14. 音声・聴覚)
- D-14-12 車室内で発生する規則性非定常騒音下での音声認識
- VQ写像を用いた2入力SSによる非定常騒音下音声認識の検討 - 自動車内走行騒音への適用 -
- D-14-21 音声認識における特徴ベクトルの補間及びフレーム間引き手法の検討
- 音声認識技術の変遷
- D-14-10 N-gram言語モデルを用いた音声対話システムにおける冗長語処理の検討
- タスクの例文を用いた自由発話音声認識のための言語モデルの構築
- SD-3-3 N-gramモデルを用いた音声対話システムのための音声認識の検討
- D-14-20 音声対話システムにおける少量テキストを用いた言語モデルのタスク適応に関する検討
- 自由発話音声認識のためのトライ音節モデルの検討
- 音声対話システムにおける教師なし話者適応の検討
- 音声対話システムにおける湧き出し誤りのリジェクト方式の検討
- 認識結果の信頼度を考慮した教師無し話者適応方式の検討
- 位取り用語を含んだ連続数字音声認識の検討
- D-14-7 符号化データを用いた音声認識方式の検討
- 住所認識のための部分辞書選択法の検討
- D-14-12 背景騒音に頑健な音声コマンドの検討(D-14. 音声・聴覚, 情報・システム1)
- D-14-4 連続音声認識における音節継続時間情報を用いた演算量削減(D-14.音声・聴覚,一般講演)
- D-14-6 統計言語モデルを用いた連続音声認識における単語グループ間バイグラムの削減(D-14.音声・聴覚,一般講演)
- 音声認識技術
- 音声認識技術とその応用 (特集 IT時代のヒューマンインタフェース技術)
- ピッチパタンの統計モデルに基づく句境界情報を利用した文節スポッティング
- 単語リジェクト方式のキーワードスポッティングによる評価
- D-5-2 接尾文字列の事前探索による形態素解析の効率化(D-5.言語理解とコミュニケーション,一般講演)
- D-14-17 大語彙音声認識における言い換え語の自動生成の検討(D-14. 音声・聴覚, 情報・システム1)
- D-14-14 複数の音響モデルに対するビームサーチ法の検討
- D-14-8 非定常騒音下における終端フリー化アルゴリズムの検討
- D-14-7 必須形態素の検証によるテキスト検索の改善(D-14.音声,一般セッション)
- 拡散音場理論に基づく残響環境下音声認識
- 音声認識における継続時間長制御の高精度化の検討
- データベース検索のための大語彙音声認識方式の検討
- 拡散音場理論に基づく残響環境下音声認識
- 小規模マイクロホンアレーを用いた音声認識のための雑音除去(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- カーナビゲーション用音声インタフェース技術
- 文節スポッティングにおける未知語検出方式の改良
- 自由発話音声における音韻の変形傾向を考慮した音響モデル構成法の検討
- 文節スポッティングにおける未知語処理方式の検討
- 意味主導型音声理解システムのための文節スポッティングの改良
- ベクトル量子化話者適応のHMM音韻認識への適用
- 住所認識のための辞書分割法の検討
- 電力運用分野における電話連絡システムの実証試験
- 音声検索技術とその応用 (特集 ヒューマンインタフェースを支える先端技術 : 新たな価値創造に向けて)
- 音声と騒音の密度比推定を用いた音声区間検出法 (音声)
- 姓名認識のための音節ネットワーク構成法の検討
- A-11-1 超音波センサの指向性と強度比を利用した開口合成画像からの虚像除去(A-11.超音波,一般セッション)
- 音声と騒音の密度比推定を用いた音声区間検出法(音声入力・区間検出,認識,理解,対話,一般)
- 小規模マイクロホンアレーを用いた車室内音声認識のための雑音除去(音声,聴覚)
- D-14-6 発話スイッチレス音声認識のためのサブワード言語モデルによる尤度検証(D-14.音声)
- 騒音環境下音声認識に対する識別的アプローチの有効性 : 第2回CHiMEチャレンジ(雑音対策,認識,理解,対話,一般)
- D-14-5 外耳道孔装着マイクを用いた音声認識(D-14.音声)
- 音声と騒音の密度比推定を用いた音声区間検出法
- A-4-6 2値マスクと独立ベクトル分析を併用したセミブラインド音源分離(A-4.信号処理,一般セッション)