音声の長時間スペクトル特性を考慮したアダプティブマイクロホンアレーによる音声認識
スポンサーリンク
概要
- 論文の詳細を見る
テレビ会議システムやヒューマノイドの聴覚システムなどでは、離れた場所にある音源からの希望する音(目的音)を高音質に受音することが望まれる。しかし、実環境では背景雑音や残響などにより、音質が劣化する問題がある。この問題の有効な解決策としてマイクロホンアレーの利用が検討されている。本稿では目的音や用途に適したマイクロホンアレー設計の第一歩として音声認識に適した適応形マイクロホンアレーを提案する。受音器には適応形マイクロホンアレーの1つであるAMNOR(Adaptive Microphone-array for NOise Reduction)を用い、雑音抑圧フィルタ設計の際、音声の周波数特性に応じた雑音抑圧を行なうことを試みた。音声認識実験の結果、計算量の削減という点において、提案アレーが有効であることがわかった。
- 社団法人電子情報通信学会の論文
- 1999-08-06
著者
-
山田 武志
筑波大学
-
鹿野 清宏
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
中村 哲
奈良先端科学技術大学院大学情報科学研究科
-
鹿野 清宏
奈良先端科学技術大学院大学
-
岡田 有加
奈良先端大
-
西浦 敬信
奈良先端科学技術大学院大学情報科学研究科
-
岡田 有加
奈良先端科学技術大学院大学 情報科学研究科
-
山田 武志
筑波大学 電子・情報工学科
-
中村 哲
奈良先端科学技術大学院大学
関連論文
- 独立成分分析を導入した空間的サブトラクションアレーによるハンズフリー音声認識システムの開発(音声,聴覚)
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (音声)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- CENSREC-1-C : 雑音下音声区間検出評価基盤の構築
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 実走行車内音声認識の評価データベースCENSREC-3とその共通評価ベースライン
- 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(ポスターセッション)(第5回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(第5回音声言語シンポジウム : ポスターセッション)
- B-11-1 IP網における音声の客観品質評価に用いる擬似音声信号の検討(B-11.コミュニケーションクオリティ,一般セッション)
- 空間パワースペクトルの主成分分析に基づく時間断続信号の検出(音響信号処理/聴覚/一般)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- ひずみ感と帯域感を考慮した楽音符号化方式の最適品質設計法(ネットワーク)
- 符号化劣化要因と周波数帯域及びパケット損失を考慮した楽音の客観品質評価法(アプリケーション品質,モバイルP2P,ユビキタスネットワーク,アドホックネットワーク,センサネットワーク,一般)
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 雑音抑圧された音声の主観・客観品質評価法
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 周波数領域でのブラインド信号分離における分離行列の補間
- 連続音声認識コンソーシアム2001年度版ソフトウエアの概要
- B-11-2 雑音抑圧音声の総合品質推定モデルを適用したフルリファレンス客観品質評価法(B-11.コミュニケーションクオリティ,一般セッション)
- 環境音モデルとHMM合成を用いた文章発話に対する音声区間検出の検討
- 環境音モデルと HMM 合成による音声区間検出法
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価(第5回音声言語シンポジウム : ポスターセッション)
- BS-5-4 雑音抑圧音声のMOSと単語了解度の客観推定(BS-5.QoE最前線-情報通信サービスにおけるユーザ体感品質-,シンポジウムセッション)
- 符号化パラメータとパケット損失を考慮したAV通信品質の推定モデル(NW性能管理, NW品質, 一般)
- AURORA-2J/AURORA-3Jデータベースとその評価ベースライン
- 雑音下音声認識のための複数の前処理手法の統合とそのAURORA-2Jによる評価
- 音声認識のためのマイクロホンアレー設計尺度についての検討
- 環境音モデルとHMM合成を用いた音声区間検出法の音声認識への適用
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法(マルチメディア通信とQoS, VoIP, ストリーミング, 一般)
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法
- SLP雑音下音声認識評価のためのWG : 評価データ収集について
- SLP雑音下音声認識評価ワーキンググループ活動報告
- 音源分離におけるSVMを用いた音源数推定法について
- 音源分離におけるSVMを用いた音源数推定法について
- ブラインド信号分離における音源数推定法について
- 符号化音声の客観品質評価に用いる擬似音声の有効性
- 残留エコー特性の客観測定に用いるテスト信号の比較
- 楽音波形の折れ線近似に基づくVariable bit-rate符号化の一検討
- 帯域とビットレートを考慮した楽音符号化品質設計法
- CSP法による音源位置同定を備えたマルチビームフォーミング
- マイクロホンアレーを用いたCSP法に基づく複数音源位置推定
- 音声の長時間スペクトル特性を考慮した適応形マイクロホンアレーによる音声認識
- 音声の長時間スペクトル特性を考慮したアダプティブマイクロホンアレーによる音声認識
- 白色相互相関の同期加算による複数音源位置推定
- 3次元N-best探索に基づく複数音源の同時認識
- 適応型アレーを用いた3次元ビタビ探索に基づくハンズフリー音声認識 (ヒューマンインタフェースとインタラクション)
- 最尤推定法に基づくマイクロホンアレーを用いた複数音源位置推定
- 3次元ビタビ探索に基づくハンズフリー音声認識におけるAMNORの効果
- マイクロホンアレーを用いた発話者方向検出によるハンズフリー音声認識(次世代ヒューマンインタフェース・インタラクション)
- 3次元ビタビ探索に基づくハンズフリー音声認識における適応型アレーの効果
- 楽音波形の折れ線近似 Variable bit-rate 符号化方式の適応量子化による品質改善
- B-11-34 帯域感とひずみ感を考慮した符号化楽音の客観品質評価法(B-11. コミュニケーションクオリティ, 通信2)
- 周波数領域でのブラインド信号処理アルゴリズムの比較
- B-11-19 楽音と音声の双方に適用できる客観品質評価法の検討(B-11.コミュニケーションクオリティ,一般セッション)
- B-11-17 EモデルのR値を固定したときの遅延と音質の関係(B-11. コミュニケーションクオリティ)
- B-11-18 雑音抑圧音声の客観品質評価に用いる総合品質推定モデルの改良(B-11.コミュニケーションクオリティ,一般セッション)
- 符号誤り音声に対する客観品質評価尺度の検討
- ブラインド信号処理における反射音の抑制について
- 状態空間モデルを用いたBlind Source Separationの音声信号分離に関する検討
- 雑音抑圧音声の主観・客観品質評価法
- B-11-21 広帯域符号化音声の客観品質評価法の検討(B-11. コミュニケーションクオリティ)
- 符号化劣化要因とパケット損失を考慮した楽音の客観品質評価法(触覚,五感メディアの品質,一般)
- 広帯域符号化音声に対応したオピニオンモデルにおける遅延劣化要因評価値の検討(触覚,五感メディアの品質,一般)
- B-11-10 広帯域符号化音声の装置劣化要因評価値の検討(B-11.コミュニケーションクオリティ,一般講演)
- 広帯域符号化音声の装置劣化要因評価値(NW性能管理, NW品質, 一般)
- B-11-33 広帯域符号化音声の量子化歪み劣化単位(B-11. コミュニケーションクオリティ, 通信2)
- 劣決定音源分離のための分離音声のケプストラムスムージング
- ハンズフリー音声通信のための雑音抑圧手法の主観・客観品質評価
- 雑音抑圧手法の主観・客観品質からの音声認識性能の推定
- 多チャンネルウィーナーフィルタを用いた音源分離におけるスパースモデルと最小二乗誤差モデルの性能比較 (応用音響)
- 球状スピーカアレーを用いた放射特性制御のシミュレーション (応用音響)
- 高次モーメント分析に基づく非線形MUSICによる劣決定方向推定 (応用音響)
- B-11-16 IP網を活用した音楽サービスの客観品質評価法(B-11. コミュニケーションクオリティ,一般セッション)
- D-14-1 雑音抑圧音声の主観品質評価におけるミュージカルノイズの影響(D-14.音声,一般セッション)
- A-10-9 フルランク空間相関行列モデルに基づく拡散性雑音除去(A-10.応用音響,一般セッション)
- D-14-9 日本語スピーキングテストにおける文生成問題の採点に影響を及ぼす要因の検討(D-14.音声,一般セッション)
- D-14-8 日本語スピーキングテストにおける文章読み上げ問題の採点に影響を及ぼす要因の検討(D-14.音声,一般セッション)
- 周波数依存の時間差モデルによる劣決定BSS
- 日本語発話能力測定ウェブシステムのための留学生発話分析(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- 日本語発話能力測定ウェブシステムのための留学生発話分析(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- 日本語発話能力測定ウェブシステムのための留学生発話分析
- 日本語発話能力測定ウェブシステムのための留学生発話分析
- 単一音源区間情報を用いた非同期マイクロホンアレーによる音声強調(ブラインド信号処理,一般)
- 多変量確率モデルによる脳波の信号分離