音素弁別特徴ベクトルを用いた頑健な音声認識の検討
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,入力音声から音素弁別特徴(DPF)を抽出し,頑健な音声認識システムを実現する方法を検討する.音素弁別特徴抽出過程では,まず入力音声を局所特徴(LF)に変換した後,LFとΔPから成る音響特徴系列を多層ニューラルネットワーク(MLN)に通すことで,音素弁別特徴へ写像する.MLNの出力は,前後のコンテキストを含む33次元(11次元×3)の音素弁別特徴を使用する.評価実験では,MLNの出力ユニットの構成に関する比較を行った後,提案のDPFパラメータと標準的なMFCCパラメータセットを比較する.実験の結果,clean speechではほぼ同等の性能を達成することを不特定話者孤立単語認識実験から示す.また,DPFパラメータの耐雑音性能を4種類の加法性雑音を重畳して評価し,1種類を除き標準パラメータセットと比較して良好な結果が得られることを示す.提案方法とMFCCとの組み合わせについても評価を行う.
- 2002-12-12
著者
-
マクダーモット エリック
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
福田 隆
豊橋技術科学大学大学院工学研究科
-
新田 恒雄
豊橋技術科学大学
-
山本 航
豊橋技術科学大学 大学院工学研究科
関連論文
- 音声認識応用に関する学会試行標準
- 幼児エージェントにおけるバイアスの形成と言語の構造化
- スライド共有による質疑応答機能を組み込んだ講義システムの開発(e-Learningコンテンツ/一般)
- Suffix Arrayを用いた音声文書の高速検索
- ウェブブラウザ上で動作可能なマルチモーダル対話システム(プラットフォーム)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 2ZJ-6 動画視聴時の注目点を考慮した動画推薦方法の提案(人間行動,障害等支援,学生セッション,コンピュータと人間社会)
- 3ZA-7 デフォルメ地図の地上座標系へのマッピングを利用した現地情報提供システム(ITSネットワーク・地図情報,学生セッション,ネットワーク)
- DS-2-5 共有信念に基づく発話場面の推定(DS-2. 共生コンピューティング,シンポジウムセッション)
- DS-1-11 Cellプロセッサを用いた音声検索エンジンの高速化(DS-1. COMP-NHC学生シンポジウム,シンポジウムセッション)
- 生徒の検索情報を利用した講義の重要語抽出
- 幼児の学習バイアスを利用したエージェントによる語意学習の効率化
- 語彙学習エージェントにおけるバイアスの自律調整について
- 因果性に基づく信念形成モデルとN本腕バンディット問題への適用
- マルチモーダル対話システムのための階層的アーキテクチャの提案
- 重要語句に対する関連スライド群抽出法の検討(オープンソースソフトウェアの教育利用/一般)
- エージェントによる語意学習効率化のための対話戦略獲得
- Agent-Agent 対話により獲得した戦略に対する人間-Agent 対話からの実験評価
- 語意自動獲得における学習バイアスの効果
- アンサンブル型最小分類誤り学習法の実装と実験的評価(一般セッション,CV・パターン認識のための学習・最適化)
- アンサンブル型最小分類誤り学習の提案(テーマ関連セッション2,コンピュータビジョンとパターン認識のための学習理論)
- アンサンブル型最小分類誤り学習の提案(テーマ関連セッション2)
- 音素弁別特徴ベクトルの対数正規分布近似を用いた雑音環境下音声認識(認識・理解・対話)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- カルマンフィルタによる音声認識のための特徴量トラジェクトリ生成法
- 静的特徴量時系列と動的特徴量時系列の関係を用いたトラジェクトリパラメータ生成による音声認識手法
- 大語彙連続音声認識におけるビームサーチ性能向上のための言語モデル同期化法
- 有限状態変換器で定義される任意の音声認識タスクのための時間同期ビタービデコーダ
- 最大幾何マージン最小分類誤り学習法を目指して
- 判別関数の一般形に対する幾何マージンの導出とその制御を伴う最小分類誤り学習(テーマセッション,CV・パターン認識のための学習・最適化)
- 最小分類誤り学習における幾何マージンの制御法について(音響モデル,認識,理解,対話,一般)
- 調音運動HMM音声合成における調音特徴--声道パラメータ変換と音源の改良 (音声)
- 調音運動HMM音声合成における調音特徴--声道パラメータ変換と音源の改良 (言語理解とコミュニケーション)
- 音声認識のための周辺特徴の検討
- 音声認識のための周辺特徴の検討
- 音声認識のための周辺特徴の検討
- 調音運動HMM音声合成における調音特徴-声道パラメータ変換と音源の改良
- 静的・動的情報を利用したMMIシステムの設計と実装(検索・対話)
- 受講情報を利用した学習支援機能付き講義再現システムの開発(遠隔教育/一般)
- 3ステージMLNと抑制/強調処理に基づく調音特徴抽出(ポスターセッション,第10回音声言語シンポジウム)
- 3ステージMLNと抑制/強調処理に基づく調音特徴抽出(ポスターセッション,第10回音声言語シンポジウム)
- 3ステージMLNと抑制/強調処理に基づく調音特徴抽出(ポスターセッション,第10回音声言語シンポジウム)
- 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム)
- 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム)
- 背景雑音を対象とした特徴パラメータ正準化法(ポスターセッション)(第6回音声言語シンポジウム)
- 音声認識のための特徴パラメータ正準化法の検討(認識・理解・対話)
- 音声認識のための特徴パラメータ正準化法の検討(認識・理解・対話)
- 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(ポスターセッション)(第5回音声言語シンポジウム)
- 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討(ポスターセッション)(第5回音声言語シンポジウム)
- 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(第5回音声言語シンポジウム : ポスターセッション)
- 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討(第5回音声言語シンポジウム : ポスターセッション)
- 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(第5回音声言語シンポジウム : ポスターセッション)
- 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討(第5回音声言語シンポジウム : ポスターセッション)
- 直交化音素弁別特徴ベクトルを用いた雑音に頑健な音声認識
- 音素弁別特徴を用いた頑健な対話音声認識 : モーラ単位サブワードモデルの検討(認識・理解・対話)
- 音素弁別特徴ベクトルを用いた頑健な音声認識の検討
- 音素弁別特徴ベクトルを用いた頑健な音声認識の検討
- 音素弁別特徴ベクトルを用いた頑健な音声認識の検討
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 音声言語インタフェースのための情報処理学会試行標準
- 音声認識読み記号および音声関連ソフトウエアに係わる用語の試行標準案
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- 複合音響特徴平面に基づく音声認識のための局所特徴抽出法(音声情報処理 : 現状と将来技術論文特集)
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
- 階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
- 最小識別誤り学習と重み付き有限状態トランスデューサによる大語彙音声認識
- 最小分類誤りを用いた連続音素認識の最適化
- LVQ-HMM混合アルゴリズムの再評価
- 意味属性を利用したクラスN-gram言語モデルの評価(言語モデル)(第6回音声言語シンポジウム)
- 意味属性を利用したクラスN-gram言語モデルの評価(言語モデル)(第6回音声言語シンポジウム)
- 意味属性を利用したクラスN-gram言語モデルの評価(言語モデル)(第6回音声言語シンポジウム)
- 音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討
- マスキング処理を併用したピッチ同期ZCPA(一般)
- 頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討
- 逐次増加型最小分類誤り学習によるパターン認識(パターン認識)
- 生成モデルを用いた音声認識(国際ワークショップ"Beyond HMM")
- 生成モデルを用いた音声認識(国際ワークショップ"Beyond HMM")
- 生成モデルを用いた音声認識(国際ワークショップ"Beyond HMM")
- HMM-SMハイブリッド音声認識のための信頼度の検討
- 0-gram汎用LVCSRと音素弁別特徴ベクトルを利用した対話音声認識の検討
- O-gram汎用 LVCSRと音素弁別特徴ベクトルを利用した対話音声認識の検討
- 0-gram汎用LVCSRと音素弁別特徴ベクトルを利用した対話音声認識の検討
- 汎用LVCSRを用いた対話音声の認識
- 汎用LVCSRを用いた対話音声の認識
- 発話中における単音の音響的品質正規化の検討
- 発話中における単音の音響的品質正規化の検討
- 発話中における単音の音響的品質正規化の検討
- 周辺特徴抽出とCMN制御を用いた認識タスクに依存しない音声認識性能の改善法(音声言語情報処理とその応用)
- 音声認識の前処理としてのCMNと修正CMNの性能比較
- 幾何マージンに基づく誤分類尺度を用いた最小分類誤り学習法(パターン認識)
- 単語・文音声双方に高い認識性能を持つ周辺特徴抽出方式
- 単語・文音声双方に高い認識性能を持つ周辺特徴抽出方式
- 単語・文音声双方に高い認識性能を持つ周辺特徴抽出方式