両耳聴モデルによる騒音下での音声パラメータの抽出
スポンサーリンク
概要
- 論文の詳細を見る
音声での遠隔操作を想定した状況での認識システムの普及を妨げる原因のーつに, 耐雑音が低いことがあげられる. 本研究は, カクテルパーティ効果として知られる人間の信号分離能力の一部を模擬した両耳聴モデルを音声認識システムのフロントエンドとして用いることにより, 認識システムの耐雑音性の向上を目指すものである. 本研究で用いられている両耳聴モデルは, 1980年台からルール大学で開発されたものものを音声認識向けに改良したものを用いた. シミュレーション実験の結果, 認識対象となる音声と騒音の方向が等しい場合にもSNR=10dBまで認識率90%が得られ, 45度以上離れた場合はSNR=-5dB程度でも同程度の認識率が得られることが明らかとなった.
- 社団法人電子情報通信学会の論文
- 1996-03-15
著者
関連論文
- インターネットを利用した学会, 研究活動
- 衝撃音のノイジネスに及ぼす暗騒音の影響
- 孔あきパイプを有するだ円空胴マフラーの共振
- 気流を考慮しただ円空胴の4端子定数
- 同軸孔あきパイプマフラーの音響特性解析
- 気流を考慮した出入口を有する楕円筒空胴の特性
- モデル推定による楽音のエコー除去
- 二次経路における遅延時間推定機構をもつ適応アルゴリズム
- インターノイズ 91 報告
- 帯域分割法を用いたブラインド信号分離による音声信号抽出
- 三角関数を用いたブラインド信号分離の一提案
- 周波数追従型DXHSアルゴリズムによる救急車警告音のアクティブ制御
- ブラインド方式による信号分離の一提案
- Delayed-X Harmonics Synthesizerアルゴリズムの周波数追従特性の検討
- 負荷分散型マルチプラットフォーム対応発話訓練システムの実装
- 負荷分散型マルチプラットフォーム対応発話訓練システムの実装(画像符号化・通信・ストリーム技術, 及び一般)
- 負荷分散型マルチプラットフォーム対応発話訓練システムの実装(画像符号化・通信・ストリーム技術, 及び一般)
- 負荷分散型マルチプラットフォーム対応発話訓練システムの実装(画像符号化・通信・ストリーム技術, 及び一般)
- MFBラウドネススピーカを用いた周期音のアクティブコントロール
- 両耳聴モデルによる騒音下での音声パラメータの抽出
- 発話評価フィードバックを有する遠隔日本語訓練システムにおけるユーザインタフェースの検討(e-Learning教育システムの成果と目指すべきもの/一般)
- 日本語初習者を対象とした日本語遠隔学習システム構築の試み
- 反復型エコー除去法を応用した音源分離
- 非対称マザーウェーブレットを利用した時間周波数領域の解析 : 音声信号を用いたマザーウェーブレットの検討
- 183 全学的情報リテラシー教育の実施に至るまで(体系的教育課程の編成I,第47セッション)
- 周波数領域両耳聴モデルによる音源方向推定と音源分離(音声・音響情報システム及び一般)
- 周波数領域両耳聴モデルによる音源方向推定と音源分離(音声・音響情報システム及び一般)
- 周波数領域両耳聴モデルによる音源方向推定と音源分離(音声・音響情報システム及び一般)
- 2次元方向推定および分離機能を有する両耳補聴システムに関する検討(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- 周波数領域両耳聴モデルの実装とその基本特性解析
- [招待論文]両耳聴モデルに基づく音源の2次元方向推定と信号分離(音響信号処理及び一般)
- [招待論文]両耳聴モデルに基づく音源の2次元方向推定と信号分離(音響信号処理及び一般)
- 周波数領域両耳聴モデルを用いた音源方向推定と音源分離
- 音響分野の教育のために,今できること
- サウンドインテンシティ : 理論と応用, F.J.Fahy著, 橘秀樹訳, オーム社, Tel.03-3233-0641, 1998, A5判, 325頁, 5,500円(税別)
- 物体の回折特性を用いた2次元DOA推定手法の検討 : 画角外音源に対応した対象物自動追尾カメラのための方向推定
- DXHSアルゴリズムによる救急車電子サイレン音の制御
- 周波数・遅延推定機構を有するDXHSアルゴリズムによる電子サイレン音の能動制御
- 周波数・遅延推定機構を有するDXHSアルゴリズムによる電子サイレン音の能動制御
- DXHSアルゴリズムによる多チャネル能動制御システムに関する検討
- 複合正弦波による特定高調波の能動制御 : Delayed-X Harmonics Synthesizerアルゴリズム
- 日本語発話訓練のための顔画像処理 : 顔データベースの構築(画像符号化・通信・ストリーム技術,及び一般)
- 日本語発話訓練のための顔画像処理 : 顔データベースの構築(画像符号化・通信・ストリーム技術,及び一般)
- 日本語発話訓練のための顔画像処理 : 顔データベースの構築(画像符号化・通信・ストリーム技術,及び一般)
- 平面アレーシステムによる複数音源の同時分離抽出適応ノッチフィルタの周波数特性を考慮した処理に関する検討
- 行列演算ソフトウェアGNU Octaveによる音響信号処理(「研究のツールボックス」(3))
- 日本語発話訓練のための顔画像処理顔データベースの構築
- BeamformingとBlind Deconvolutionによる信号源の推定
- Signal Specific Analyzing Waveletを用いた不特定話者の音声解析
- ディジタル蝸牛モデルを用いた騒音下での音声パラメータの抽出
- テレビの音声リモートコントロール(その2) : マスキングモデルによる改良 : コンシューマエレクトロニクス
- 室内放射音の音源方向の推定法の性能評価
- 2002年日中音響学会議
- テレビの音声リモートコントロール(その2) : マスキングモデルによる改良
- サブバンドARMAモデルを用いた室内の伝達関数モデリング
- 心理音響モデルを用いた信号歪み・雑音の客観的評価手法
- 周波数領域両耳聴モデルによる分離音声を用いた音声認識システムに関する検討
- ブラインド方式による定常雑音除去
- 非線形処理を用いたブラインドスペクトルサブトラクション
- 周波数領域における両耳聴モデルと音声強調への応用
- テレビの音声リモートコントロール : ひらけごまテレビ : コンシューマエレクトロニクス
- ブラインド方式によるスペクトルサブトラクションの一提案
- ウィナーフィルタにおける信号対雑音比の自動設定について
- 系の零点を考慮したオンラインエコー除去法
- 系の零点を考慮した反復型エコー除去法
- ケプストラムを用いた楽音推定
- 逆フィルタが不安定となる場合の原音信号推定
- 信号検出における選択聴取の効果
- 調波構造に基づく音声強調システムの音声認識への応用 : 方向情報によるピッチ抽出の改善
- 時系列情報によるピッチ抽出の検討
- 可変コムフィルタを用いた音声の抽出
- 可変タップ長LMS適応フィルタにおけるダブルトーク及び経路変化の検出
- 3次元空間における音波到来方向に基づく信号抽出
- フィードフォワード型のアクティブ制御用アルゴリズム(アクティブ制御のあゆみと今後)
- 調波型Analyzing Waveletを用いた音声ピッチ周波数推定法の検討
- Signal Specific Analyzing Waveletによる時間周波数解析 -基本周波数成分が欠落した調波信号の基本周波数推定-