ランニングスペクトルフィルタを用いた雑音にロバストな音声認識(信号処理, LSI, 及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
実環境で音声認識を使用する際,雑音が大きな問題となる.本報告では,ランニングスペクトルにフィルタリングを施し雑音の影響を低減する手法を提案する.ランニングスペクトルとは短時間スペクトルの時間軌跡のことで,音声認識において重要な特徴であることが知られている.提案手法は,パワースペクトルの時間軌跡にローパスフィルタを,対数パワースペクトルの時間軌跡にバンドパスフィルタをかけるというものである.4種類の雑音を人工的に付加した孤立単語認識実験の結果,特に低SNRにおいて現在広く用いられているRASTA法, CMS法に比べ高い認識率を得た.
- 社団法人電子情報通信学会の論文
- 2003-06-19
著者
-
畑岡 信夫
(株)日立製作所中央研究所
-
宮永 喜一
北海道大学工学部
-
畑岡 信夫
東北工業大学知能エレクトロニクス学科
-
早坂 昇
株式会社レイトロン
-
早坂 昇
北海道大学大学院情報科学研究科
-
和田 直哉
北海道大学
-
畑岡 信夫
東北工業大学 工学部 知能エレクトロニクス学科
-
宮永 喜一
北海道大学
-
早坂 昇
北海道大学大学院工学研究科
-
和田 直哉
北海道大学大学院情報科学研究科
-
早坂 昇
北海道大学 大学院情報科学研究科
関連論文
- 8x8 MIMO-OFDM受信機におけるパイプライン型MMSE検出器のLSI設計 (スマートインフォメディアシステム)
- 4x4 MIMO-OFDM受信機における動的再構成可能なMMSE検出器のLSI設計(スマートパーソナルシステム,一般)
- MIMO-OFDM方式における差分判定を用いたタイミング同期の一考察(スマートパーソナルシステム,一般)
- 音声を利用したマルチモーダルインタフェース
- 音響学会員のためのインターネット概説
- 音声とペンを入力手段とするマルチモーダルインタフェースの構築
- 音声・ポインティング・CGによるエージエント型ユーザインタフェースシステム
- SA-6-4 音声・ポインティング・CGによるエージェント型ユーザインタフェースシステム(SA-6. メディア変換・統合技術とヒューマンコミュニケーション,シンポジウム)
- 効率良い正規表現照合のための並列ビット分配にもとづいたハードウェア指向アルゴリズム (コンピュータシステム)
- 効率良い正規表現照合のための並列ビット分配にもとづいたハードウェア指向アルゴリズム (VLSI設計技術)
- エージェントシステムによる環境適応型OFDM方式コグニテイブ無線の特性評価(一般,技術展示,チュートリアル講演,一般)
- 音声認識技術の実用化に向けた自動車内実環境での評価実験
- 遺伝的アルゴリズムを適用した帰納的学習による機械翻訳手法 (GA-ILMT) における淘汰処理の改良
- 遺伝的アルゴリズムを用いた帰納的学習による機械翻訳手法(GA-ILMT)における翻訳例を利用した淘汰処理の精度向上
- 遺伝的アルゴリズムを用いた帰納的学習による機械翻訳手法の性能向上のための改良
- 音声認識のためのマルチレートシステムを用いたスペクトルサブトラクション法(音声,聴覚)
- 高精度RSAによる音声雑音除去(スマートパーソナルシステム,一般)
- 音声雑音除去におけるミュージカルノイズの軽減に関する一手法(スマートパーソナルシステム,一般)
- RSFを用いた音声雑音除去における音質の改善について(スマートパーソナルシステム, 一般)
- 音声雑音除去に関する研究 : ランニングスペクトルフィルタ(RSF)の効果
- 関連語を用いた文の分解に基づく中日機械翻訳システム
- 中日機械翻訳における離合詞の処理手法
- 中国語表層構造の特徴を利用した中日機械翻訳手法
- 日中機械翻訳における係り受け構造の可保留曖昧関係について
- 中日機械翻訳における中国語複合語の自動合成について
- 意味属性による中国語補助語の推定アルゴリズム
- 家族モデルを用いた文の分解に基づく日中機械翻訳システム
- SC-1-6 半導体磁化プラズマにおける電磁界減衰特性を利用したフォトニック結晶スイッチング素子の検討 : エアホール型単一直線導波路による構成(SC-1.光新技術の理論的課題 : 近接場ナノ光学・フォトニック結晶・負屈折率媒質)
- キラル媒質で構成した2次元フォトニック結晶光導波路における偏波面回転特性の凝縮節点空間回路網による解析
- ジャイロ異方性を利用したフォトニック結晶光導波路構造を有するスイッチング素子の検討
- FPGAによる空間回路網法電磁界シミュレータの製作
- 導体系を含む系のスカラーおよびベクトルポテンシャル空間回路網の電磁界時間応答解析
- エキゾチック媒質で構成したフォトニック結晶光導波路の凝縮節点空間回路網法による基本特性解析
- SC-1-5 ベクトルおよびスカラ場の 3 次元空間回路網による結合解析
- C-1-11 キラル基板で構成したエアホール型フォトニック結晶光導波路の特性解析 : 凝縮節点空間回路網におけるキラル媒質の取扱い
- 一軸異方性基板で構成した2次元エアホール型フォトニック結晶光導波路におけるTM波曲がり特性の凝縮節点空間回路網による解析
- SC-8-9 非線形光学効果と複合型導波路構造を利用した2次元ピラー型フォトニック結晶デバイスの検討
- C-1-19 非線形媒質特性によるフォトニック結晶構造の高調波を含んだ導波特性について
- 種々の媒質条件を含んだフォトニック結晶光導波路の電磁界解析 : 凝縮節点空間回路網による分散性および異方性誘電体の取扱い
- 変動する空間電荷分布による電磁界の空間回路網による時間応答解析
- 種々の媒質条件をもつ2次元フォトニック結晶光導波路の凝縮節点空間回路網による基本特性解析
- C-1-14 凝縮節点空間回路網による異方性媒質を含んだフォトニック結晶光導波路の解析
- 凝縮節点空間回路網による種々の媒質条件を有するフォトニック結晶光導波路の基本特性解析
- スカラーおよびベクトルポテンシャル空間回路網における変動空間電荷波源による場の特性について
- 凝縮節点空間回路網におけるフォトニック結晶特性の取り扱い
- 凝縮節点空間回路網における波源の等価電源表示
- IPデータ通信用フェムトセルを活用したローカルブレイクアウト方式の提案と評価(無線PAN,IPTV,画像符号化,ストリーム技術及び一般)
- FIFOを用いたHMM音声認識回路の小型・省電力化について(スマートパーソナルシステム,一般)
- 8x8 MIMO-OFDM受信機におけるパイプライン型MMSE検出器のLSI設計(スマートパーソナルシステム,一般)
- RSA音響モデルのロバスト性と音素間距離の検討(信号処理,LSI及び一般)
- RSA音響モデルのロバスト性と音素間距離の検討(信号処理,LSI及び一般)
- RSA音響モデルのロバスト性と音素間距離の検討(信号処理,LSI及び一般)
- A-4-24 基本周波数の時間変化に注目した雑音ロバスト音声区間検出(A-4.信号処理,一般セッション)
- RSAを用いた雑音にロバストな連続音声認識用音響モデルの構築(スマートパーソナルシステム,一般)
- 重み付け変調スペクトルを用いた耐雑音音声認識(システムオンシリコン及び一般)
- ニューラルネットにもとづく画像解析アルゴリズムについて
- ニューラルネットにもとづく画像解析アルゴリズムについて
- ニューラルネットにもとづく画像解析アルゴリズムについて
- A-4-51 基底関数ネットワークによる画像処理
- B-5-21 IEEE802.11ac対応無線LANの研究開発(2) : 80MHz帯域幅MIMO-OFDM方式の屋外特性評価(B-5.無線通信システムA(移動通信),一般セッション)
- B-5-20 IEEE802.11ac対応無線LANの研究開発(1) : 80MHz帯域MIMO-OFDM無線通信装置の開発(B-5.無線通信システムA(移動通信),一般セッション)
- 5.メディア系異分野共同研究プロジェクト(北の国から明日のICTに架ける橋,知の創出を支える次世代IT基盤技術-北海道大学グローバルCOEプログラムと北海道内情報通信系研究グループの活動-)
- A-20-8 MIMO-OFDM無線通信における忘却係数法を用いた判定帰還型伝搬路推定(A-20. スマートインフォメディアシステム,一般セッション)
- D-4-18 高速ストリーム処理のための文字列パターン照合手法とそのFPGA設計(D-4. データ工学,一般セッション)
- コグニティブ無線における学習に基づく無線データベースの構築とその探索アルゴリズムの評価 (スマートインフォメディアシステム)
- マルチモーダルインタラクション : 今、どのような視点を必要としているのか
- マイコン向け音声認識技術を用いた携帯型音声通訳機(音声情報処理 : 現状と将来技術論文特集)
- VoiceXMLインタプリタと連続単語認識エンジンの開発 : 音声ポータル向け音声認識技術の開発
- 三次元音響利用GUI提示システムにおけるアプリケーション対応
- GUI情報の三次元音響による表現方法
- ロバスト音声認識とそのLSI化について
- 音声ミドルウェアにおける連続数字認識の開発
- マルチモーダルなエージェント型ユーザインタフェースの評価と対話制御の検討
- 音声とポインティングジェスチャを入力手段としたマルチモーダルインタフェース
- 発声制約の緩和を可能にするサーチの検討
- 能率的な自動交換オペレータ
- 「音声度」 測定に基づいたノイズリジェクションの開発
- 組込み機器向け音声認識・合成ミドルウェアとその応用
- SID-2-9 ITS向け音声認識ミドルウエア技術
- SID-2-9 ITS向け音声認識ミドルウエア技術
- SD-2-5 CISを支えるマイコン用音声処理ミドルウェア
- インテリアデザイン支援システムを対象としたマルチモーダルインタフェースの評価
- 車戴用音声認識における騒音対策とその評価(音声情報処理 : 現状と将来技術論文特集)
- 家庭内マルチメディア化と端末の課題
- 国家プロジェクト : 音声認識技術の実用化(パネルディスカッション「音声認識技術の実用化」)
- 音声認識技術と応用製品(人の認識・計測)
- 音声技術実用化の課題と取り組み(音声認識のビジネス動向)
- 音声処理にかかわるインフラの現状と進歩 : マイコンCPU、メモリ、ネットワーク技術
- ランニングスペクトルフィルタを用いた雑音にロバストな音声認識(信号処理,LSI,及び一般)
- ランニングスペクトルフィルタを用いた雑音にロバストな音声認識(信号処理, LSI, 及び一般)
- ランニングスペクトルフィルタを用いた雑音にロバストな音声認識(信号処理, LSI, 及び一般)
- モバイル時代に向けた新コンセプトサービス : Mobilingual&WalkingNavi
- モバイル時代に向けた新コンセプトサービス : Mobilingual&WalkingNavi
- モバイル時代に向けた新コンセプトサービス : Mobilingual & WalkingNavi
- IEEE ASSP SocietyのTokyo Chapterの設立と、1984年IEEE音響・音声・信号処理国際会議(ICASSP 84)報告
- 携帯情報端末のためのWWW利用情報提供方式の検討
- 4-2 視覚障害者向け三次元音場利用情報提示システム (21世紀の医療・福祉を支える科学技術)
- クラスタリング・ラベリングシステムのアナログLSIによる構成
- 2000-SLP-32-7 日立の音声研究開発戦略 : 汎用マイコン用音声ミドルウェアの開発
- 視覚障害者のGUIアクセスを助ける音響技術(バリアフリーと音響技術)