3ステージMLNと抑制/強調処理に基づく調音特徴抽出(ポスターセッション,第10回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
高精度音素認識を目的とした調音特徴抽出器について述べる。提案方式は3ステージから成る。第一ステージは三つの多層ニューラルネットワーク(MLN),すなわち時間-スペクトルパターン空間の局所特徴を調音特徴空間に写像するMLN_<LF-DPF>,主に音素境界で生じる誤識別を低減するMLN_<cntxt>,およびMLN_<Dyn>を組込んでいる。次に第二ステージでは,抑制/強調処理を導入して,DPFが示す調音運動から凸パターンを強調し凹パターンを抑制することにより,各DPFパターンをカテゴリカルなものとする。最後に第三ステージで連続するDPF系列に対して,Gram-Schmidt変換を適用して相関成分を除き,HMMに基づく音素分類器に入力する。JNAS音声データを用いた音素認識実験では,提案する調音特徴抽出器は,少ないHMM混合数で高い音素認識精度を示した。
- 2008-12-02
著者
-
新田 恒雄
豊橋技術科学大学
-
フダ ムハマド
豊橋技術科学大学大学院工学研究科
-
河嶋 宏明
Graduate School of Engineering, Toyohashi University of Technology
-
新田 恒雄
Graduate School of Engineering, Toyohashi University of Technology
-
河嶋 宏明
Graduate School Of Engineering Toyohashi University Of Technology
関連論文
- 音声認識応用に関する学会試行標準
- 幼児エージェントにおけるバイアスの形成と言語の構造化
- スライド共有による質疑応答機能を組み込んだ講義システムの開発(e-Learningコンテンツ/一般)
- Suffix Arrayを用いた音声文書の高速検索
- ウェブブラウザ上で動作可能なマルチモーダル対話システム(プラットフォーム)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 2ZJ-6 動画視聴時の注目点を考慮した動画推薦方法の提案(人間行動,障害等支援,学生セッション,コンピュータと人間社会)
- 3ZA-7 デフォルメ地図の地上座標系へのマッピングを利用した現地情報提供システム(ITSネットワーク・地図情報,学生セッション,ネットワーク)
- DS-2-5 共有信念に基づく発話場面の推定(DS-2. 共生コンピューティング,シンポジウムセッション)
- DS-1-11 Cellプロセッサを用いた音声検索エンジンの高速化(DS-1. COMP-NHC学生シンポジウム,シンポジウムセッション)
- 生徒の検索情報を利用した講義の重要語抽出
- 幼児の学習バイアスを利用したエージェントによる語意学習の効率化
- 語彙学習エージェントにおけるバイアスの自律調整について
- 因果性に基づく信念形成モデルとN本腕バンディット問題への適用
- マルチモーダル対話システムのための階層的アーキテクチャの提案
- 重要語句に対する関連スライド群抽出法の検討(オープンソースソフトウェアの教育利用/一般)
- エージェントによる語意学習効率化のための対話戦略獲得
- Agent-Agent 対話により獲得した戦略に対する人間-Agent 対話からの実験評価
- 語意自動獲得における学習バイアスの効果
- 音素弁別特徴ベクトルの対数正規分布近似を用いた雑音環境下音声認識(認識・理解・対話)
- 調音運動HMM音声合成における調音特徴--声道パラメータ変換と音源の改良 (音声)
- 調音運動HMM音声合成における調音特徴--声道パラメータ変換と音源の改良 (言語理解とコミュニケーション)
- 音声認識のための周辺特徴の検討
- 音声認識のための周辺特徴の検討
- 音声認識のための周辺特徴の検討
- 調音運動HMM音声合成における調音特徴-声道パラメータ変換と音源の改良
- 静的・動的情報を利用したMMIシステムの設計と実装(検索・対話)
- 受講情報を利用した学習支援機能付き講義再現システムの開発(遠隔教育/一般)
- 3ステージMLNと抑制/強調処理に基づく調音特徴抽出(ポスターセッション,第10回音声言語シンポジウム)
- 3ステージMLNと抑制/強調処理に基づく調音特徴抽出(ポスターセッション,第10回音声言語シンポジウム)
- 3ステージMLNと抑制/強調処理に基づく調音特徴抽出(ポスターセッション,第10回音声言語シンポジウム)
- 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム)
- 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム)
- 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム)
- 音声認識のための特徴パラメータ正準化法の検討(認識・理解・対話)
- 音声認識のための特徴パラメータ正準化法の検討(認識・理解・対話)
- 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(ポスターセッション)(第5回音声言語シンポジウム)
- 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討(ポスターセッション)(第5回音声言語シンポジウム)
- 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(第5回音声言語シンポジウム : ポスターセッション)
- 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討(第5回音声言語シンポジウム : ポスターセッション)
- 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(第5回音声言語シンポジウム : ポスターセッション)
- 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討(第5回音声言語シンポジウム : ポスターセッション)
- 直交化音素弁別特徴ベクトルを用いた雑音に頑健な音声認識
- 音素弁別特徴を用いた頑健な対話音声認識 : モーラ単位サブワードモデルの検討(認識・理解・対話)
- 音素弁別特徴ベクトルを用いた頑健な音声認識の検討
- 音素弁別特徴ベクトルを用いた頑健な音声認識の検討
- 音素弁別特徴ベクトルを用いた頑健な音声認識の検討
- 音声言語インタフェースのための情報処理学会試行標準
- 音声認識読み記号および音声関連ソフトウエアに係わる用語の試行標準案
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- 複合音響特徴平面に基づく音声認識のための局所特徴抽出法(音声情報処理 : 現状と将来技術論文特集)
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
- 階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
- 階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
- 階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
- マルチモーダル対話作成支援ツールGalatea-IBの機能強化
- 大規模音声ドキュメントを対象とした高速キーワード検索システムとその評価
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 1U-10 調音特徴に基づく音素単位での英語発音誤り検出と発音評価(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェントツールキットGalatea
- 擬人化音声対話エージェント開発プロジェクト
- 擬人化音声対話エージェントツールキットの基本設計
- AAMを利用した表情成分抽出に基づく表情模倣システム(テーマ関連,顔・人物・ジェスチャ・行動)
- AAMを利用した表情成分抽出に基づく表情模倣システム(テーマ関連,顔・人物・ジェスチャ・行動)
- 英語発音学習のための調音特徴抽出と発音評価
- 階層的MMIアーキテクチャに基づくプラットフォーム実装方法の検討
- 調音運動HMMに基づくワンモデル音声認識合成
- Suffix Arrayを用いた高速なキーワード検索
- マルチモーダル対話が次世代インターフェース技術として熟成するために(マルチモーダル)
- 5U-2 柔軟なモジュール切替が可能なWebベースMMIシステムの開発(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 擬人化音声対話エージェントツールキットの基本設計
- 4Y-5 AAMを利用した表情の模倣(顔・人物画像処理(2),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 形容詞/名詞の分化と典型的事例の自己組織化に関する構成論的モデル
- 幼児エージェントにおけるバイアスの形成と言語の構造化(セッション4)
- 講義再現システムにおけるスライド重要度抽出
- SD-2-3 非言語情報を用いた講義スライド重要度抽出
- 講義再現システムにおけるスライドへの重要度自動付与法とその評価 (先端メディアの教育利用と教材データの格納・再利用/一般
- E-039 MMI6階層モデルに準拠したWebベースMMIシステムの開発(自然言語・音声・音楽,一般論文)
- Online-EMによる語意学習機構と学習バイアスの適用(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- Online-EMによる語意学習機構と学習バイアスの適用(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- Online-EMによる語意学習機構と学習バイアスの適用(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 人間とロボットが混在する対話空間の構築を目指して : 共通概念獲得方法の検討(テーマセッション(2), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- 人間とロボットが混在する対話空間の構築を目指して : 共通概念獲得方法の検討(テーマセッション(2), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- 生得的学習バイアスを適用したInfant Agentによる概念獲得([特別セッション]音声言語獲得・学習技術(1))
- 平均顔を用いたブースティングによる表情認識(一般セッション(2), ユビキタスメディアの将来展望)
- 平均顔を用いたブースティングによる表情認識(一般セッション(2), ユビキタスメディアの将来展望)
- 幼児エージェントによるバイアスの形成と言語獲得過程におけるその効果(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 幼児エージェントによるバイアスの形成と言語獲得過程におけるその効果(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 幼児エージェントによるバイアスの形成と言語獲得過程におけるその効果(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- D-12-82 表情認識における平均顔を用いた特徴抽出法の検討(D-12. パターン認識・メディア理解, 情報・システム2)
- MMIシステム構築のためのプロトタイピングツールの開発
- IEEE音響・音声・信号処理国際会議(ICASSP'99)報告
- 異なる端末環境から利用可能なMMIアプリケーション開発における記述負担の軽減(対話(1))(第6回音声言語シンポジウム)
- 意味属性を利用したクラスN-gram言語モデルの評価(言語モデル)(第6回音声言語シンポジウム)