非音声区間拡張マルチコンディション単語モデルの雑音ロバスト性に関する実験的評価
スポンサーリンク
概要
- 論文の詳細を見る
Voice activity detection (VAD) is an essential technique to develop a sophisticated voice interface. However, VAD with sufficient detection capability has not been presented yet. In particular, it is difficult that the beginning and ending of a word are accurately detected in noisy environments. In this paper, we describe extended models with multi-condition training (extended MC-models) for misdetection and evaluate their noise robustness by a large amount of word recognition simulations. From the results of the simulations, simple whole-word models degraded recognition performance when input speech signal was accompanied by non-speech segments, whereas the extended MC-models maintained the performance. Furthermore, in consideration of practical applications, we carried out the simulations combining CENSREC-1-C baseline VAD with the extended MC-models. The results also showed the usefulness of the extended MC-models under 20 and 10dB signal-to-noise ratio conditions.
- 2012-10-01
著者
-
宮永 喜一
Division Of Electronics And Information Engineering Graduate School Of Engineering Hokkaido Universi
-
早坂 昇
北海道大学大学院情報科学研究科
-
宮永 喜一
北海道大学
-
早坂 昇
北海道大学大学院工学研究科
-
宮永 喜一
北海道大学大学院 工学研究科情報通信エレクトロニクス講座
-
Miyanaga Yoshikazu
Division Of Electronics And Information Engineering Graduate School Of Engineering Hokkaido Universi
-
早坂 昇
大阪大学大学院基礎工学研究科
-
宮永 喜一
北海道大学大学院情報科学研究科情報通信ネットワーク研究室
関連論文
- 4x4 MIMO-OFDM受信機における動的再構成可能なMMSE検出器のLSI設計(スマートパーソナルシステム,一般)
- MIMO-OFDM方式における差分判定を用いたタイミング同期の一考察(スマートパーソナルシステム,一般)
- 4×4 MIMO-OFDM受信機におけるパイプライン型MMSE検出器のVLSIアーキテクチャ設計(スマートパーソナルシステム,一般)
- エージェントシステムによる環境適応型OFDM方式コグニテイブ無線の特性評価(一般,技術展示,チュートリアル講演,一般)
- 遺伝的アルゴリズムを適用した帰納的学習による機械翻訳手法 (GA-ILMT) における淘汰処理の改良
- 遺伝的アルゴリズムを用いた帰納的学習による機械翻訳手法(GA-ILMT)における翻訳例を利用した淘汰処理の精度向上
- 遺伝的アルゴリズムを用いた帰納的学習による機械翻訳手法の性能向上のための改良
- 音声認識のためのマルチレートシステムを用いたスペクトルサブトラクション法(音声,聴覚)
- 高精度RSAによる音声雑音除去(スマートパーソナルシステム,一般)
- 音声雑音除去におけるミュージカルノイズの軽減に関する一手法(スマートパーソナルシステム,一般)
- RSFを用いた音声雑音除去における音質の改善について(スマートパーソナルシステム, 一般)
- 音声雑音除去に関する研究 : ランニングスペクトルフィルタ(RSF)の効果
- ランニングスペクトルアナリシスを用いた雑音にロバストな音声認識(ソフトコンピューティング及び一般)
- 関連語を用いた文の分解に基づく中日機械翻訳システム
- 中日機械翻訳における離合詞の処理手法
- 中国語表層構造の特徴を利用した中日機械翻訳手法
- 日中機械翻訳における係り受け構造の可保留曖昧関係について
- 中日機械翻訳における中国語複合語の自動合成について
- 意味属性による中国語補助語の推定アルゴリズム
- 家族モデルを用いた文の分解に基づく日中機械翻訳システム
- SC-1-6 半導体磁化プラズマにおける電磁界減衰特性を利用したフォトニック結晶スイッチング素子の検討 : エアホール型単一直線導波路による構成(SC-1.光新技術の理論的課題 : 近接場ナノ光学・フォトニック結晶・負屈折率媒質)
- IPデータ通信用フェムトセルを活用したローカルブレイクアウト方式の提案と評価(無線PAN,IPTV,画像符号化,ストリーム技術及び一般)
- FIFOを用いたHMM音声認識回路の小型・省電力化について(スマートパーソナルシステム,一般)
- 8x8 MIMO-OFDM受信機におけるパイプライン型MMSE検出器のLSI設計(スマートパーソナルシステム,一般)
- ランニングスペクトルアナリシスを用いた連続音声認識用ロバスト音響モデルの構築
- A-4-24 基本周波数の時間変化に注目した雑音ロバスト音声区間検出(A-4.信号処理,一般セッション)
- 重み付け変調スペクトルを用いた耐雑音音声認識(システムオンシリコン及び一般)
- B-5-21 IEEE802.11ac対応無線LANの研究開発(2) : 80MHz帯域幅MIMO-OFDM方式の屋外特性評価(B-5.無線通信システムA(移動通信),一般セッション)
- B-5-20 IEEE802.11ac対応無線LANの研究開発(1) : 80MHz帯域MIMO-OFDM無線通信装置の開発(B-5.無線通信システムA(移動通信),一般セッション)
- 5.メディア系異分野共同研究プロジェクト(北の国から明日のICTに架ける橋,知の創出を支える次世代IT基盤技術-北海道大学グローバルCOEプログラムと北海道内情報通信系研究グループの活動-)
- A-20-8 MIMO-OFDM無線通信における忘却係数法を用いた判定帰還型伝搬路推定(A-20. スマートインフォメディアシステム,一般セッション)
- eラーニングと遠隔FPGAの連携による異分野共同研究環境の開発(ネットワーク,FPGA応用及び一般)
- eラーニングと遠隔FPGAの連携による異分野共同研究環境の開発(ネットワーク,FPGA応用及び一般)
- eラーニングと遠隔FPGAの連携による異分野共同研究環境の開発(ネットワーク,FPGA応用及び一般)
- マルチコンディションHMMを用いた残響ロバスト音声認識の検討(知的マルチメディアシステム,一般)
- コグニティブ無線における学習に基づく無線データベースの構築とその探索アルゴリズムの評価(システムオンシリコン,RFID技術,一般)
- ロバスト適応トータル最小乗法による信号強調
- B-5-115 MIMOシステムにおける角度広がりとライスKファクタの相関性に関する研究(B-5.無線通信システムB(無線アクセスネットワーク),一般セッション)
- 効率良い正規表現照合のための並列ビット分配にもとづいたハードウェア指向アルゴリズム(アプリケーション2,FPGA応用及び一般)
- 効率良い正規表現照合のための並列ビット分配にもとついたハードウェア指向アルゴリズム(アプリケーション2,FPGA応用及び一般)
- 効率良い正規表現照合のための並列ビット分配にもとづいたハードウェア指向アルゴリズム(アプリケーション2,FPGA応用及び一般)
- 音声信号処理システムの高速・低消費電力化について(システムオンシリコン,RFID技術,一般)
- A-20-8 マルチコンディションHMMを用いた単語音声認識における棄却手法の一考察(A-20.スマートインフォメディアシステム,一般セッション)
- A-20-7 web上のデータを利用した単語音声認識用学習データの自動構築(A-20.スマートインフォメディアシステム,一般セッション)
- K-059 HMMを利用した任意の音声データの検出(教育工学・福祉工学・マルチメディア応用,一般論文)
- B-7-41 広域基地局からフェムトセルへのセキュアリモートアクセスに関する一検討(B-7.情報ネットワーク,一般セッション)
- E-045 RSFとマルチコンディションHMMによる雑音ロバスト孤立単語音声認識(自然言語・音声・音楽,一般論文)
- RSF/DRAを用いたロバスト音声認識における特徴抽出に関する一考察(スマートパーソナルシステム,一般)
- 耐雑音音声認識における変調ケプストラム操作の効果に関する一考察(ソフトコンピューティング及び一般)
- 音声認識の様々な特徴量におけるRSF/DRAの性能評価(ソフトコンピューティング及び一般)
- 推定SNRに基づくスペクトル領域フィルタリングを用いた雑音に頑健な孤立単語音声認識(音声,聴覚)
- A-20-8 位相を用いた音声のミュージカルノイズ低減(A-20.スマートインフォメディアシステム,一般講演)
- 推定SNRに基づくRSFに関する一考察(スマートパーソナルシステム, 一般)
- ロバスト音声認識とそのLSI化について
- ランニングスペクトルフィルタリングを用いた音声の雑音低減法(音声, 聴覚)
- ロバスト音声認識システムのLSI実現に関する一考察(信号処理,LSI,及び一般)
- ロバスト音声認識システムのLSI実現に関する一考察(信号処理,LSI,及び一般)
- A-20-10 音声認識における頑健な特徴抽出に関する一考察(A-20. スマートインフォメディアシステム)
- A-20-6 スケーラビリティを持つ隠れマルコフモデル法音声認識回路(A-20. スマートインフォメディアシステム)
- スペクトルの時間変化を利用した雑音除去(合成, 韻律, 生成, 一般)
- RSF/DRA手法を用いた雑音ロバスト音声認識システムのハードウエア実現(信号処理,LSI,及び一般)
- ロバスト音声認識システムのLSI実現に関する一考察(信号処理,LSI,及び一般)
- 音声認識システムのソフトIP化について(信号処理,LSI,及び一般)
- RSF/DRA手法を用いた雑音ロバスト音声認識システムのハードウェア実現(信号処理, LSI, 及び一般)
- 音声認識システムのソフトIP化について(信号処理, LSI, 及び一般)
- RSF/DRA手法を用いた雑音ロバスト音声認識システムのハードウェア実現(信号処理, LSI, 及び一般)
- 音声認識システムのソフトIP化について(信号処理, LSI, 及び一般)
- ランニングスペクトルフィルタを用いた雑音にロバストな音声認識(信号処理,LSI,及び一般)
- メルケプストラムを用いたロバスト音声区間検出(信号処理,LSI,及び一般)
- ランニングスペクトルフィルタを用いた雑音にロバストな音声認識(信号処理, LSI, 及び一般)
- メルケプストラムを用いたロバスト音声区間検出(信号処理, LSI, 及び一般)
- ランニングスペクトルフィルタを用いた雑音にロバストな音声認識(信号処理, LSI, 及び一般)
- メルケプストラムを用いたロバスト音声区間検出(信号処理, LSI, 及び一般)
- A-20-5 広帯域MIMO-OFDMに対応した無線動画伝送装置の開発(A-20.スマートインフォメディアシステム,一般セッション)
- 語長キャリブレーションを用いた無線OFDMベースバンド受信機の低消費電力化(通信方式,ソフトコンピューティング,一般)
- 広帯域MIMO-OFDM無線伝送装置の開発と屋外伝搬実験(システムオンシリコン,RFID技術,一般)
- 8x8 MIMO-OFDM受信機におけるパイプライン型MDCアーキテクチャを用いた128点FFTプロセッサの回路設計(システムオンシリコン,RFID技術,一般)
- FPGAを用いた5GHz帯2x2MIMO-OFDM方式無線映像伝送装置の開発(FPGA応用)
- AS-5-6 8x8 MIMO-OFDM方式ベースバンド送受信機の設計開発(AS-5.公共、民間サービスにおける無線ネットワーク技術の研究開発動向,シンポジウムセッション)
- 広帯域MIMO-OFDM無線システムにおける映像伝送部のハードウェア・ソフトウェア協調開発(スマートパーソナルシステム,一般)
- 動的MIMO検出法を用いたMIMO-OFDM受信機回路の低消費電力化(スマートパーソナルシステム,一般)
- 大規模MIMO無線システムにおけるASIPアーキテクチャを用いた特異値分解プロセッサの設計開発(スマートパーソナルシステム,一般)
- 簡略化RSFを用いた雑音ロバスト音声認識の検討(スマートパーソナルシステム,一般)
- 被写体の色分布を考慮した4原色LCDの色彩設計(画像)
- 孤立単語音声認識を用いた雑音ロバストキーワードスポッティング(知的マルチメディアシステム,一般)
- SVD-MIMO-OFDMシステムにおける特異値分解プロセッサの高速・低消費電力化設計 (スマートインフォメディアシステム)
- MIMO-OFDM方式におけるPTS手法に基づくPAPR低減に関する検討 (スマートインフォメディアシステム)
- 雑音に強くなる!最新技術動向を紹介 音声認識に大敵の雑音を低減するメカニズム (特集 シリアル接続のワンチップIC/モジュールで試す! タッチ・パネル/リモコンはもう古い? 会話でマシンを動かす! 研究! 音声認識&合成) -- (音声認識編)
- 郊外エリアにおける遮蔽・反射板を用いた見通しMIMO通信実験評価(アダプティブアンテナ,等化,干渉キャンセラ,MIMO,無線通信,一般)
- A-3-11 動的電源電圧ビット長制御によるViterbiデコーダの低電力化(A-3.VLSI設計技術,一般セッション)
- 非音声区間の拡張とマルチコンディション学習による 区間検出誤りに頑健な単語モデルの実験的考察 (音声処理(2))
- 非音声区間拡張マルチコンディション単語モデルの雑音ロバスト性に関する実験的評価
- 非音声区間拡張マルチコンディション単語モデルの雑音ロバスト性に関する実験的評価
- 細粒度並列処理を用いたMU-MIMOプリコーディング回路の高速化手法の提案(初めての研究会,初めての研究会,鉄道,車車間・路車間通信,リソース制御,スケジューリング,無線通信一般)
- 適応無線通信システムのためのMIMO伝搬シナリオ識別手法に関する一検討(初めての研究会,初めての研究会,鉄道,車車間・路車間通信,リソース制御,スケジューリング,無線通信一般)
- MIMO-OFDM方式におけるPTS手法に基づくPAPR低減に関する検討(スマートパーソナルシステム,一般)
- SVD-MIMO-OFDMシステムにおける特異値分解プロセッサの高速・低消費電力化設計(スマートパーソナルシステム,一般)
- 伝送距離に応じた低消費電力無線通信システム
- 雑音環境下における破裂音に対するロバスト音声認識
- IDMA無線システム実現のための干渉除去器ハードウェア実装(一般,初めての研究会,鉄道,車車間・路車間通信,リソース制御,スケジューリング,無線通信一般)