音素決定木に基づく逐次状態分割法によるHM-Netの性能改善の検討
スポンサーリンク
概要
- 論文の詳細を見る
限られた学習サンプルから高精度かつ頑健な音素環境依存モデルを生成するためには,パラメータの共有関係をどのように決定するか,未知の音素環境をどのように扱うかが重要である.このような観点から,我々は音素決定木に基づく逐次状態分割法の(Decision Tree-based Successive State Splitting DT-SSS)を提案し,この手法によって自動生成されたHM-Netが高精度かつあらゆる音素環境を表現可能であることを示した[13].しかし, DT-SSSには時間方向の状態分割が組み込まれておらず,この手法によって生成されたHM-NetはSSSの特徴を十分に反映したモデルではなかった.本報告では, DT-SSSの性能改善のために時間方向の状態分割を導人し,様々な初期モデルからの状態分割を試みて,連続音素認識実験により性能を比較する.また,頑健性向上とパラメータ数削減のために,過度に分割が行われた状態の再共有化についても検討する.
- 一般社団法人情報処理学会の論文
- 1996-12-12
著者
関連論文
- Quinphone HM-Netを用いた単語グラフ統合に基づく講演音声認識 (音声)
- SP2000-25 N-gramに基づくエルゴディックHMMによる言語モデル
- 離散分布型HMMによる単語音声認識におけるビタビbest-firstサーチの検討
- Eurospeech99, IEEE MMSP99会議報告
- Quinphone HM-Netを用いた単語グラフ統合に基づく講演音声認識(音声・言語・音響教育,一般)
- 音声雑音環境下における音声区間検出の検討
- 話者クラス音響モデルを用いた講演音声認識の性能向上(音響モデル,認識,理解,対話,一般)
- 音素モデルを用いた話者ベクトルに基づく話者識別の検討(第8回音声言語シンポジウム)
- 音素モデルを用いた話者ベクトルに基づく話者識別の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音素モデルを用いた話者ベクトルに基づく話者識別の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声認識のための確率文脈自由文法に基づく言語モデルの構築と評価(音声情報処理 : 現状と将来技術論文特集)
- 確率文脈自由文法を用いた言語モデルの構築と音声認識実験による評価
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 連続音声認識コンソーシアム2000年度版ソフトウエアの概要と評価
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討 (音声言語情報処理)
- 大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討
- 大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討
- 大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討
- 連続/セミ連続分布型HMMによる単語音声認識のViterbi best-firstサーチにおける推定スコア設定法の検討
- 状態クラスタリングによるHM-Netの構造決定法の検討
- 状態クラスタリングによるHM-Netを用いた大語彙連続音声認識システムの検討
- 音素連接HMMを用いた尤度正規化に基づくワードスポッティングの検討
- 音素連接HMMを用いた尤度正規化に基づくワードスポッティングの検討
- 状態クラスタリングによるHM-Netの構造決定法の検討
- 状態クラスタリングによるHM-Netの構造決定法の検討
- 音素連接HMMを用いた尤度正規化に基づくワードスポッティングの検討
- 状態クラスタリングによるHM-Netの構造決定法の検討
- 音素決定木に基づく逐次状態分割法によるHM-Netの検討
- 音素連接HMMに基づく尤度正規化を用いたワードスポッティングの検討
- 状態クラスタリングによるHM-Netの構造決定法の検討
- 音素決定木に基づく逐次状態分割法による HM-Net の性能改善の検討
- 音素決定木に基づく逐次状態分割法によるHM-Netの性能改善の検討
- HMMの状態系列に基づく単語予備選択法の検討
- 音素決定木に基づく逐次状態分割法によるHM-Netの性能改善の検討
- 大語彙言語データベースからのN-gram構築とタスク適応の検討
- 離散混合分布HMMのヒストグラム同等化を用いたコードブック正規化(認識・理解・対話・一般)
- 発音変形依存モデルを用いた講演音声認識(音声,聴覚)
- 離散混合分布型HMMによる講演音声認識の検討(多言語, CSJ, 認識・理解・対話・一般)
- ETSI標準フロントエンドを用いた雑音下音声認識の検討(認識・理解・対話)
- ETSI標準フロントエンドを用いた雑音下音声認識の検討(認識・理解・対話)
- 離散混合出力分布型HMMを用いた非定常雑音下の音声認識(ポスターセッション)(第5回音声言語シンポジウム)
- 離散混合出力分布型HMMを用いた非定常雑音下の音声認識(第5回音声言語シンポジウム : ポスターセッション)
- 離散混合出力分布型HMMを用いた非定常雑音下の音声認識(第5回音声言語シンポジウム : ポスターセッション)
- 講演音声認識における音響・言語モデルの話者適応の検討(認識・理解・対話)
- MAP推定を用いた離散混合出力分布型HMMの雑音重畳音声での評価(認識・理解・対話)
- かな・漢字文字列を単位とした言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- かな・漢字文字列を単位とした言語モデルの検討
- かな・漢字文字列を単位とした言語モデルの検討
- 音素グラフに基づく仮説制限法を用いた大語彙連続音声認識の検討
- 確率文脈自由文法を用いたHMM-LR文節音声認識におけるViterbi best-firstサーチの検討
- 確率文脈自由文法を用いたHMM-LR文節音声認識におけるViterbi best-firstサーチの検討
- HMM-LRによる文節音声認識におけるViterbi-best firstサーチの検討
- VQひずみに基づく推定コストを用いるDP best-firstサーチの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 単語グラフ生成におけるパラメータ最適化の検討
- 単語グラフ生成におけるパラメータ最適化の検討
- 単語グラフ生成におけるパラメータ最適化の検討
- SP2000-26 単語グラフ生成の言語重み・挿入ペナルティ最適化の検討
- SP2000-19 話者照合におけるMLLRベースの話者モデル作成の検討
- MLLR適応におけるMDL基準に基づく回帰クラスタ設定の検討
- 尤度差に基づくn-gram言語モデル評価のための指標
- 音素決定木に基づく逐次状態分割法によるHM-Netの検討
- 音素決定木に基づく逐次状態分割法によるHM-Netの検討
- 連続分布型HMMによる単語音声認識におけるViterbi best-firstサーチの検討
- 係り受け文法による確率文脈自由文法を用いた言語モデルの検討
- 話者照合における話者モデルのMLLR適応の検討
- 話者照合における話者モデルのMLLR適応の検討