Denoising Autoencoderを用いた残響下大語彙音声認識の検討
スポンサーリンク
概要
- 論文の詳細を見る
Denoising Autoencoder を用いて残響が重畳した対数パワースペクトルからその影響を除去した対数パワースペクトルを生成する手法を提案する.音声の時間変化をモデル化するため,提案法では連続した複数の短時間分析窓によるスペクトルフレームを連結したものをネットワークの入力として用いる.さらに,音声認識に必要なサブ音素レベルでの時間分解能を維持しながら時定数の大きな残響の影響をより正しく捕らえることを目的として,長さの異なる 2 つの分析窓長を併用する拡張手法を提案する.実験では,CENSREC-4 を用いた数字音声認識により提案法が従来手法よりも効果的であることを示す.さらに,JNAS を用いた音声認識を行い,提案法が大語彙連続音声認識においても耐残響フロントエンドとして有効であることを示す.
- 2013-07-18
著者
-
堀内 靖雄
東京工業大学工学部情報工学科
-
堀内 靖雄
千葉大学工学部
-
堀内 靖雄
千葉大 大学院融合科学研究科
-
堀内 靖雄
東京工業大学工学部
-
堀内 靖雄
千葉大学大学院 融合科学研究科 情報科学専攻
関連論文
- 話者交替規則に基づいた日本手話対話の話者交替の分析
- ヒューマンインタフェースシンポジウム2009報告
- ヒューマンインタフェースシンポジウム2007報告
- 日本手話の表現速度の違いによる手動作変化の分析(福祉と音声処理,一般)
- Webページ間の関係に着目した大規模サイトの構造化の調査 : 音声ブラウザ利用におけるアクセシビリティの検討
- 視覚障害者のウェブサイトの検索行動に関する考察(福祉と音声処理,一般)
- 視覚障害者のアクセシビリティを考慮した Web ページ作成のためのビルダの検討
- 視覚障害者のアクセシビリティを考慮したWebページ作成のためのビルダの検討(特定領域研究「情報福祉の基礎」)
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 5.音声の知見の情報福祉への応用(バリアフリー社会に向けた音声情報処理)
- コンピュータ音楽国際会議(ICMC 1993)論文セッション報告
- 対話音声の抑揚の記述
- 日本手話の後続うなずきの機能に関する検討(福祉情報工学一般)
- ブレスの合図を認識する伴奏システムの実装と評価(システム)
- 日本手話対話における発話末のうなずきタイミングの分析
- 手話と音声の比較によるうなずきのタイミングに関する分析
- 非対称な3人会話における合意形成場面の収録と予備的分析
- 位置と動きに基づくマルチストリームHMMを用いた手話認識
- 手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
- 手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
- 視覚障害者のウェブサイトの検索行動に関する考察(福祉と音声処理,一般)
- 複数の人間と協調する演奏システム
- 複数の人間と協調して演奏するシステム
- 指点字の強度と時間構造におけるプロソディ情報の分析(福祉情報工学一般)
- 伴奏システムのためのリハーサル
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 書き起こしへの付与を目指した音声とテキストを対象とした発話印象の分析
- 日本手話対話におけるうなずきの機能に関する基礎的検討
- 早口再合成音声における韻律強調と聞き取りやすさの関係の分析
- 音声認識の信頼度に着目した文境界検出に関する検討
- 視覚障害者のための意味情報を用いた仮名漢字変換における説明語選択手法の検討(福祉と音声処理,一般)
- 曲中のブレスによる合図を利用した伴奏システム
- 日本手話対話の話者交替時の重複現象の分析
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- ブレスによる合図を検出する伴奏システム
- 特集「音楽情報処理」の編集にあたって
- 順位統計量を用いた話者照合のためのコホート話者選択方法 (音声)
- 発言権を考慮した指点字と文字による会議システムの構築(視聴覚補助,情報福祉論文)
- 指点字を利用した盲聾者用エディタの開発(福祉と言語処理/一般)
- 指点字を利用した盲聾者用エディタの開発(福祉と言語処理/一般)
- 自主性を持つ伴奏システム
- 伴奏者の自主性を考慮した自動伴奏システム : テンポ感と依存度を利用した伴奏制御
- 演奏フィードバックを用いた伴奏システム
- 時間的差分学習に基づく環境適応による音声認識(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 時間的差分学習に基づく環境適応による音声認識(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 時間的差分学習に基づく環境適応による音声認識(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 強化学習を用いた環境適応とクラスタリングに基づく音声認識
- LG-003 強化学習に基づくオンライン逐次環境適応による雑音下音声認識(G. 音声・音楽)
- 手話における手動作のモデル化に基づくCGアニメーションの生成(福祉と知能・認知障害/一般)
- 手話における手動作のモデル化に基づくCGアニメーションの生成(福祉と知能・認知障害/一般)
- 伴奏システムでのブレス情報利用に関する検討
- 音声認識の信頼度に着目した文境界検出に関する検討 (音声)
- 日本手話におけるうなずきと接続詞の分析(福祉と音声処理,一般)
- 日本手話におけるうなずきと接続詞の分析(福祉と音声処理,一般)
- 日本手話の表現速度の違いによる手動作変化の分析(福祉と音声処理,一般)
- 音声対話に対する談話セグメントのタグ方式の検討
- 指点字会議システムの試作(視覚障害/聴覚障害/一般)
- 視覚障碍者用WWWブラウザのUI設計
- 視覚障碍者用WWWブラウザのUI設計
- 視覚障碍者用WWWブラウザのUI設計
- 伴奏システムの協調動作の評価
- K-017 全盲者のウェブサイトのユーザビリティと検索効率に関する考察(教育工学・福祉工学・マルチメディア応用,一般論文)
- 発話予測を利用した手話対話システムに関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 発話予測を利用した手話対話システムに関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 発話予測を利用した手話対話システムに関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- STRAIGHTを用いたF0モデルパラメータの変換・再合成ツールの開発(一般(ポスターセッション),第9回音声言語シンポジウム)
- STRAIGHTを用いたF0モデルパラメータの変換・再合成ツールの開発(一般(ポスターセッション),第9回音声言語シンポジウム)
- STRAIGHTを用いたF0モデルパラメータの変換・再合成ツールの開発(一般(ポスターセッション),第9回音声言語シンポジウム)
- F0モデルを用いた日本語対話における韻律と話者交替の分析(合成,生成,韻律,一般)
- 音声対話におけるN-gramと予測文を併用した対システム発話の判別(合成,生成,韻律,一般)
- 3. 伴奏システム ( 音楽情報処理)
- 人間の伴奏制御モデルに基づく伴奏システムの実装と評価
- 音声対話システムによる意思決定を促す発話がユーザに与える影響の分析
- 単語の時間構造を考慮した手話CGアニメーションの生成(福祉と知能・認知障害/一般)
- 単語の時間構造を考慮した手話CGアニメーションの生成(福祉と知能・認知障害/一般)
- メトロノームを利用した手話の時間構造の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 予測文と音素認識の併用による発話の予測内外判定に関する検討(インタフェース)
- 拡張LR構文解析アルゴリズムによる未定義語を含む日本語文の構文解析
- 心的負荷状況における車載情報機器のための音声対話戦略の分析(第8回音声言語シンポジウム)
- 心的負荷状況における車載情報機器のための音声対話戦略の分析(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 心的負荷状況における車載情報機器のための音声対話戦略の分析(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声認識での予測文候補の選択についての検討
- 手話対話解析のためのデータ構築(福祉と音声処理及び一般)
- パーティクルフィルタとHMMによる動画像からの手話認識に関する検討(コミュニケーションの心理及び一般)
- 順位統計量を用いたテキスト独立型話者照合手法(音声,聴覚)
- Q&Aコーナー(コーヒーブレーク)
- 視覚障害支援のための意味情報に基づく仮名漢字変換(福祉工学)
- Kinectとパーティクルフィルタを用いたHMM手話認識手法の検討(テーマセッション,時系列パターン認識)
- Kinectとパーティクルフィルタを用いたHMM手話認識手法の検討(テーマセッション,時系列パターン認識)
- 日本手話対話と日本語音声対話における話者交替現象の比較分析(福祉情報工学一般,ライフイノベーションのための介護・リハビリ・生活支援技術)
- 隠れマルコフモデルを用いた眼電位認識の研究(一般セッション,時系列パターン認識)
- 隠れマルコフモデルを用いた眼電位認識の研究(一般セッション,時系列パターン認識)
- 隠れマルコフモデルを用いた眼電位認識の研究
- 日本手話対話と日本語音声対話における話者交替現象の比較分析
- Kinect とパーティクルフィルタを用いたHMM手話認識手法の検討
- Denoising Autoencoderを用いた残響下大語彙音声認識の検討
- 名演奏家の合奏録音における伴奏者の演奏タイミング制御の分析