RSAを用いた雑音にロバストな連続音声認識用音響モデルの構築(スマートパーソナルシステム,一般)
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,連続音声認識システムのロバスト性を高めるために,ロバスト性を高めた音響モデルの構築を行った.音響モデルの学習に用いる発声データのMFCCベクトルに,発話単位でMFCCベクトルの変調スペクトル上の音声認識に寄与しない15Hz以上の高周波成分を削減するRSAを適用することにより音声強調を行った.このデータの作成方法と,これを利用したトライフォン音響モデルを構築法の説明し,通常の音響モデルに比べてロバストな連続音声認識が可能になることを実験により確認し,本手法の有効性を示した.
- 社団法人電子情報通信学会の論文
- 2008-06-06
著者
-
宮永 喜一
北海道大学工学部
-
大貫 和永
釧路工業高等専門学校
-
高橋 亘
北海道大学第1内科
-
宮永 喜一
北海道大学
-
高橋 亘
北海道大学大学院情報科学研究科
-
宮永 喜一
北海道大学大学院 工学研究科情報通信エレクトロニクス講座
-
大貫 和永
釧路工業高等専門学校情報工学科
-
宮永 喜一
三菱電機特機システム株式会社
-
高橋 亘
北海道大学医学部第一内科
関連論文
- 8x8 MIMO-OFDM受信機におけるパイプライン型MMSE検出器のLSI設計 (スマートインフォメディアシステム)
- 4x4 MIMO-OFDM受信機における動的再構成可能なMMSE検出器のLSI設計(スマートパーソナルシステム,一般)
- MIMO-OFDM方式における差分判定を用いたタイミング同期の一考察(スマートパーソナルシステム,一般)
- 効率良い正規表現照合のための並列ビット分配にもとづいたハードウェア指向アルゴリズム (コンピュータシステム)
- 効率良い正規表現照合のための並列ビット分配にもとづいたハードウェア指向アルゴリズム (VLSI設計技術)
- エージェントシステムによる環境適応型OFDM方式コグニテイブ無線の特性評価(一般,技術展示,チュートリアル講演,一般)
- 遺伝的アルゴリズムを適用した帰納的学習による機械翻訳手法 (GA-ILMT) における淘汰処理の改良
- 遺伝的アルゴリズムを用いた帰納的学習による機械翻訳手法(GA-ILMT)における翻訳例を利用した淘汰処理の精度向上
- 遺伝的アルゴリズムを用いた帰納的学習による機械翻訳手法の性能向上のための改良
- 音声認識のためのマルチレートシステムを用いたスペクトルサブトラクション法(音声,聴覚)
- 高精度RSAによる音声雑音除去(スマートパーソナルシステム,一般)
- 音声雑音除去におけるミュージカルノイズの軽減に関する一手法(スマートパーソナルシステム,一般)
- RSFを用いた音声雑音除去における音質の改善について(スマートパーソナルシステム, 一般)
- 音声雑音除去に関する研究 : ランニングスペクトルフィルタ(RSF)の効果
- 関連語を用いた文の分解に基づく中日機械翻訳システム
- 中日機械翻訳における離合詞の処理手法
- 中国語表層構造の特徴を利用した中日機械翻訳手法
- 日中機械翻訳における係り受け構造の可保留曖昧関係について
- 中日機械翻訳における中国語複合語の自動合成について
- 意味属性による中国語補助語の推定アルゴリズム
- 家族モデルを用いた文の分解に基づく日中機械翻訳システム
- SC-1-6 半導体磁化プラズマにおける電磁界減衰特性を利用したフォトニック結晶スイッチング素子の検討 : エアホール型単一直線導波路による構成(SC-1.光新技術の理論的課題 : 近接場ナノ光学・フォトニック結晶・負屈折率媒質)
- キラル媒質で構成した2次元フォトニック結晶光導波路における偏波面回転特性の凝縮節点空間回路網による解析
- ジャイロ異方性を利用したフォトニック結晶光導波路構造を有するスイッチング素子の検討
- FPGAによる空間回路網法電磁界シミュレータの製作
- 導体系を含む系のスカラーおよびベクトルポテンシャル空間回路網の電磁界時間応答解析
- エキゾチック媒質で構成したフォトニック結晶光導波路の凝縮節点空間回路網法による基本特性解析
- SC-1-5 ベクトルおよびスカラ場の 3 次元空間回路網による結合解析
- C-1-11 キラル基板で構成したエアホール型フォトニック結晶光導波路の特性解析 : 凝縮節点空間回路網におけるキラル媒質の取扱い
- 一軸異方性基板で構成した2次元エアホール型フォトニック結晶光導波路におけるTM波曲がり特性の凝縮節点空間回路網による解析
- SC-8-9 非線形光学効果と複合型導波路構造を利用した2次元ピラー型フォトニック結晶デバイスの検討
- C-1-19 非線形媒質特性によるフォトニック結晶構造の高調波を含んだ導波特性について
- 種々の媒質条件を含んだフォトニック結晶光導波路の電磁界解析 : 凝縮節点空間回路網による分散性および異方性誘電体の取扱い
- 変動する空間電荷分布による電磁界の空間回路網による時間応答解析
- 種々の媒質条件をもつ2次元フォトニック結晶光導波路の凝縮節点空間回路網による基本特性解析
- C-1-14 凝縮節点空間回路網による異方性媒質を含んだフォトニック結晶光導波路の解析
- 凝縮節点空間回路網による種々の媒質条件を有するフォトニック結晶光導波路の基本特性解析
- スカラーおよびベクトルポテンシャル空間回路網における変動空間電荷波源による場の特性について
- 凝縮節点空間回路網におけるフォトニック結晶特性の取り扱い
- 凝縮節点空間回路網における波源の等価電源表示
- IPデータ通信用フェムトセルを活用したローカルブレイクアウト方式の提案と評価(無線PAN,IPTV,画像符号化,ストリーム技術及び一般)
- FIFOを用いたHMM音声認識回路の小型・省電力化について(スマートパーソナルシステム,一般)
- 8x8 MIMO-OFDM受信機におけるパイプライン型MMSE検出器のLSI設計(スマートパーソナルシステム,一般)
- RSA音響モデルのロバスト性と音素間距離の検討(信号処理,LSI及び一般)
- RSA音響モデルのロバスト性と音素間距離の検討(信号処理,LSI及び一般)
- RSA音響モデルのロバスト性と音素間距離の検討(信号処理,LSI及び一般)
- A-4-24 基本周波数の時間変化に注目した雑音ロバスト音声区間検出(A-4.信号処理,一般セッション)
- RSAを用いた雑音にロバストな連続音声認識用音響モデルの構築(スマートパーソナルシステム,一般)
- 重み付け変調スペクトルを用いた耐雑音音声認識(システムオンシリコン及び一般)
- ニューラルネットにもとづく画像解析アルゴリズムについて
- ニューラルネットにもとづく画像解析アルゴリズムについて
- ニューラルネットにもとづく画像解析アルゴリズムについて
- A-4-51 基底関数ネットワークによる画像処理
- B-5-21 IEEE802.11ac対応無線LANの研究開発(2) : 80MHz帯域幅MIMO-OFDM方式の屋外特性評価(B-5.無線通信システムA(移動通信),一般セッション)
- B-5-20 IEEE802.11ac対応無線LANの研究開発(1) : 80MHz帯域MIMO-OFDM無線通信装置の開発(B-5.無線通信システムA(移動通信),一般セッション)
- 5.メディア系異分野共同研究プロジェクト(北の国から明日のICTに架ける橋,知の創出を支える次世代IT基盤技術-北海道大学グローバルCOEプログラムと北海道内情報通信系研究グループの活動-)
- A-20-8 MIMO-OFDM無線通信における忘却係数法を用いた判定帰還型伝搬路推定(A-20. スマートインフォメディアシステム,一般セッション)
- D-4-18 高速ストリーム処理のための文字列パターン照合手法とそのFPGA設計(D-4. データ工学,一般セッション)
- コグニティブ無線における学習に基づく無線データベースの構築とその探索アルゴリズムの評価 (スマートインフォメディアシステム)
- OFDM方式コグニティブ無線のハードウェア設計に関する考察(信号処理,知的マルチメディアシステム,及び一般)
- 80MHz帯域幅OFDM方式における通信品質および増幅器歪みの評価 : PAPRを低減することによる通信品質向上に関する検討(信号処理,知的マルチメディアシステム,及び一般)
- OFDM方式コグニティブ無線のハードウェア設計に関する考察(信号処理,知的マルチメディアシステム,及び一般)
- 80MHz帯域幅OFDM方式における通信品質および増幅器歪みの評価 : PAPRを低減することによる通信品質向上に関する検討(信号処理,知的マルチメディアシステム,及び一般)
- OFDM方式コグニティブ無線のハードウェア設計に関する考察
- 80MHz帯域幅OFDM方式における通信品質および増幅器歪みの評価 : PAPRを低減することによる通信品質向上に関する検討
- 環境適応型OFDMシステムに関する一考察(MIMO, OFDM,コグニティブ無線,パネル討論,一般)
- IEEE802.11n OFDM無線LANシステムにおける省面積化を実現する可変FFTプロセッサ(MIMO, OFDM,コグニティブ無線,パネル討論,一般)
- 高速電力線通信のための新しい狭帯域干渉除去(システムオンシリコン,RFID技術及び一般)
- A-20-13 IEEE802.11n規格に基づくマルチモードOFDM復調回路の省面積化(A-20.スマートインフォメディアシステム,一般講演)
- A-20-11 マルチキャリア方式におけるドップラ周波数推定法の検討(A-20.スマートインフォメディアシステム,一般講演)
- 移動環境下における無線LANの検討(ソフトコンピューティング及び一般)
- 動的再構成可能なVSF-OFCDM用逆拡散器(スマートパーソナルシステム, 一般)
- マッチドフィルタの高速化に関する一考察(画像システム,知的マルチメディア処理システム及び一般)
- A-20-4 演算量を低減した並列マッチトフィルタの設計(A-20. スマートインフォメディアシステム)
- アナログ行列演算器を用いた音声認識回路
- アナログ行列演算器を用いた音声認識回路
- アナログ行列演算器を用いた音声認識回路
- 短時間フーリエ変換器のアナログ回路構成について
- eラーニングと遠隔FPGAの連携による異分野共同研究環境の開発(ネットワーク,FPGA応用及び一般)
- eラーニングと遠隔FPGAの連携による異分野共同研究環境の開発(ネットワーク,FPGA応用及び一般)
- eラーニングと遠隔FPGAの連携による異分野共同研究環境の開発(ネットワーク,FPGA応用及び一般)
- 実例に基づく機械翻訳手法における類似文検索手法
- 実例に基づく機械翻訳手法における類似文検索手法
- マルチコンディションHMMを用いた残響ロバスト音声認識の検討(知的マルチメディアシステム,一般)
- コグニティブ無線における学習に基づく無線データベースの構築とその探索アルゴリズムの評価(システムオンシリコン,RFID技術,一般)
- A-20-14 ドップラー周波数閾値判定によるOFDM適応変調の検討(A-20.スマートインフォメディアシステム,一般セッション)
- 80MHz帯域OFDM方式無線通信システムの検討とOFDM変復調回路の設計(スマートパーソナルシステム, 一般)
- 局所的話速変化検出を指向した簡易セグメンテーション手法と実環境音声への適用について
- 局所的話速変化検出を指向した簡易セグメンテーション手法と実環境音声への適用について
- 局所的話速変化検出のための音韻変化検出システムの複数話者適応に関する検討
- 無声化音中の音韻変化を考慮した局所的話速度変化検出に関する基礎的検討
- 信号強調のための並列アルゴリズムとその誤差解析
- ロバスト適応トータル最小2乗法による音声強調
- マルチレート複素RLS法の追従性と浮動小数点誤差の解析
- 適応TLS法による雑音劣化した狭帯域信号の強調
- 制約つきヘッブ型学習則を用いたシングルセンサ信号強調
- 時変ARパラメータ推定におけるマルチレート複素RLS法の効果
- 時変 AR モデルのサブバンド適応同定におけるレート変換に関する一考察
- 多重最小二乗規範を用いた音声スペクトルの並列適応推定
- B-5-115 MIMOシステムにおける角度広がりとライスKファクタの相関性に関する研究(B-5.無線通信システムB(無線アクセスネットワーク),一般セッション)