双方向型OM-LSA雑音抑圧を用いた雑音下音声認識
スポンサーリンク
概要
- 論文の詳細を見る
本発表では,時間軸上で双方向型に拡張されたOM-LSA雑音抑圧方式を提案するとともに,雑音環境下音声認識における有効性を実験により示す.従来のOM-LSA雑音抑圧方式では,推定誤差の累積により十分な雑音抑圧性能が得られなかった場合でも,新方式では高い性能が得られる.また,順方向の推定においても,簡易な先読み方式を導入することにより,推定の安定性を更に増している.独自データを用いた実験に加えて,CENSREC-2による実験でも,提案手法の有効性を確認することができた.
- 2012-03-09
著者
-
大淵 康成
(株)日立製作所中央研究所
-
武田 龍
京都大学大学院情報学研究科
-
戸上 真人
日立製作所・中央研究所
-
大淵 康成
日立製作所・中央研究所
-
大淵 康成
新情報処理開発機構新機能日立1研究室(株)日立製作所中央研究所
-
武田 龍
日立製作所中央研究所
-
戸上 真人
株式会社日立製作所中央研究所
関連論文
- 音声認識実用化技術の展開(総合報告)
- 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚
- 5R-7 歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発(音楽検索・解析,学生セッション,人工知能と認知科学)
- 4Q-3 実環境音声対話システムにおけるバージイン発話タイミングを活用した指示対象の同定(音声対話・音声要約,学生セッション,人工知能と認知科学)
- 音声認識応用に関する学会試行標準
- VoiceXMLをベースにした頑強な音声対話管理アーキテクチャ(自然言語情報処理研究会と一部合同開催 : 自動車内音声対話関連)
- 車載情報サービス用音声対話コーパス(自然言語情報処理研究会と一部合同開催 : 自動車内音声対話関連)
- ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用
- ニホンアマガエルの同期した発声行動に関する数理的研究および音響信号解析 (第5回生物数学の理論とその応用)
- 人間共生型ロボットEMIEW2における音源方向推定機能
- 垂直配置マイクロホンアレーを利用した卓上突発音除去機能を備える遠隔会議システム (システム開発論文特集)
- ニホンアマガエルの同期した発声行動に関する実験的研究およびその数理モデル解析
- 音声認識における頑健性 : 音響分析・音響モデル,なにが課題か(企画)
- 垂直配置マイクロホンアレーを利用した卓上突発音除去機能を備える遠隔会議システム(音声システム,システム開発論文)
- 音声認識技術の実用化に向けた自動車内実環境での評価実験
- ボタンレス音声インタフェースのための音声コマンド検知技術 (特集 音声認識技術の実用化への取り組み)
- E-022 生活環境下でのボタンレス音声認識のための評価データベース構築(自然言語・音声・音楽,一般論文)
- 任意語彙音声発話検索のための多段階リスコアリング手法の性能評価
- 人間共生ロボットEMIEWの騒音下音声認識技術
- A-1-16 スパース度の推定処理を特徴とする過完備基底の音源分離手法(A-1.回路とシステム,一般講演)
- 音源重複度判定に基づく音源定位を用いた音源分離手法
- 5 ボタンレス音声インタフェースのための音声コマンド検知技術(音声認識技術の実用化への取り組み)
- 2X-8 音楽と自分の声を聞き分けながらビートに合わせて発声するロボットの開発(音楽情報科学(1)音楽音響,学生セッション,人工知能と認知科学)
- バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用
- [パネルディスカッション]音声認識技術がキャズムを越えるには?
- バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用
- 実世界に存在する音声・音響を対象とした認識技術
- 音声認識実用化技術の展開
- 独立成分分析に基づく適応フィルタのロボット聴覚への適用
- 遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上
- マイコン向け音声認識技術を用いた携帯型音声通訳機(音声情報処理 : 現状と将来技術論文特集)
- マイコン向け音声認識技術を用いた携帯型音声通訳機(音声処理技術のデモの紹介)
- D-14-27 音声による単語入力機能を持つ携帯型通訳機の開発
- 3U-1 ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価(音声言語情報処理,学生セッション,人工知能と認知科学)
- E-052 バージインを許容するロボット音声対話のためのICAを用いたセミブラインド音源分離(E分野:自然言語・音声・音楽)
- クプストラムを用いた感情識別手法の検討
- ミッシングフィーチャ理論に基づく音声認識を用いた複数話者同時発話認識
- 6J-7 ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- バージイン発話タイミングモデルを導入した指示対象同定
- バージイン発話タイミングモデルを導入した指示対象同定
- バージイン発話タイミングモデルを導入した指示対象同定
- 非零対角要素を持つホップフィールドニューラルネットを用いたLSIモジュール配置法
- 発語行為レベルの情報を用いた音声対話システムの構築とデータ分析
- 移動ベクトルの相関に関する事前知識を利用した話者適応
- 音声認識における音響照合の信頼性尺度に関する検討
- カオスニューラルネットワークの最適化能力の検証
- SA-1 あなたを助ける音声認識(科学技術の最前線を学ぶ,第108回日本外科会定期学術集会)
- デルタケプストラム正規化とチャネル選択の組合せによる耐雑音音声認識方式(音声, 聴覚)
- ICA2004,第18回国際音響学会議
- カーナビ応用を目指した頑強な耐雑音認識方式 : 音響モデルの出現確率に基づく音声/雑音判定
- 携帯電話向け音声通訳システムの開発と公開実験
- 「音声度」 測定に基づいたノイズリジェクションの開発
- 定型文認識を用いた携帯電話向け音声通訳システム
- 組込み機器向け音声認識・合成ミドルウェアとその応用
- SID-2-9 ITS向け音声認識ミドルウエア技術
- SID-2-9 ITS向け音声認識ミドルウエア技術
- 汎用マイコンにおける音声認識・合成ミドルウエアの紹介
- 環境適応機能付き音声認識ミドルウエア
- SHマイクロプロセッサ向け音声認識ミドルウエアの開発
- 事前知識を利用した話者適応方式の改良と教師なし適応への応用
- Fogel, D. B. : An Introduction to Simulated Evolutionary Optimization, IEEE Trans. on Neural Networks, Vol.5, pp.3-14 (1994).
- 音声検索実用化の現状と課題
- 発語行為レベルの情報をユーザ発話の解釈に用いる音声対話システム
- 発話権交替モデルの照合に基づく会話クラスタリング(研究速報)
- 系と信号源の時変モデルに基づく残響除去・音響エコーキャンセラ・雑音除去の確率的最適結合法 (応用音響)
- 双方向型OM-LSA雑音抑圧を用いた雑音下音声認識 (応用音響)
- 多段リスコアリングに基づく大規模音声中の任意検索語検出(音声,聴覚)
- マイクロフォンアレイに基づく雑音除去による人間共生ロボットEMIEW2の頑健な音声認識 (応用音響)
- マイクロフォンアレイに基づく雑音除去による人間共生ロボットEMIEW2の頑健な音声認識
- 系と信号源の時変モデルに基づく残響除去・音響エコーキャンセラ・雑音除去の確率的最適結合法
- 双方向型OM-LSA雑音抑圧を用いた雑音下音声認識
- マイクロフォンアレイに基づく雑音除去による人間共生ロボットEMIEW2の頑健な音声認識
- 2-2 音源分離技術を利用した撮影範囲の音声抽出技術(2.携帯電話の聞く技術,携帯電話の聞く・聞かせる技術)
- 統計的雑音抑圧法の強調的適用による雑音環境下音声区間検出(音声特徴量)
- 系と信号源の時変モデルに基づく残響除去・音響エコーキャンセラ・雑音除去の確率的最適結合法
- 双方向型OM-LSA雑音抑圧を用いた雑音下音声認識