離散分布型HMMによる単語音声認識におけるビタビbest-firstサーチの検討
スポンサーリンク
概要
- 論文の詳細を見る
HMMによる音声認識をグラフサーチの問題とみなし,ビームサーチの技法を利用して,当該節点までのスコアのみに基づく枝刈りや,forward-backwardサーチのようにより単純なモデルを用いた認識処理に基づく当該節点以降の推定スコアも考慮した枝刈りが検討された^<(1)〜(4)>.また,best-firstサーチの技法を利用して,スタックデコーディング法のように厳密なA^*探索に必ずしもこだわらない実用的な探索法や,tree-trellisサーチのようにN-best候補の探索に対して高速化を図る方法が検討された^<(5),(8)>.本論文では,best-firstサーチの技法を利用して,HMMのビタビアルゴリズムによる認識処理に対して高速化を図る方法を検討し,最大経路スコアに基づく推定スコア設定法および単純な音素HMMを利用する推定スコア設定法を提案した.ビタビbest-firstサーチは,推定スコアを適切に設定すれば,認識率を低下させずに,認識処理で主要な部分を占める経路展開の計算量が1%以下となり,計算量低減の効果が非常に大きいことを示した.単純な音素HMMを利用する推定スコアは,時間軸の順序関係が考慮されるので精度が良いが,推定スコア設定に大きな計算量を必要とする.経路展開の計算量と推定スコア設定の計算量の両方を考慮すると,単語内最大経路スコアに基づく推定スコアが最も良い.この推定スコアは,A^*探索の条件を満たすので,最適解も保証される.
- 社団法人電子情報通信学会の論文
- 1994-07-25
著者
関連論文
- SP2000-25 N-gramに基づくエルゴディックHMMによる言語モデル
- 離散分布型HMMによる単語音声認識におけるビタビbest-firstサーチの検討
- 聴取実験システムマニュアル
- 基本周波数包絡が異なる感情音声聴取時の脳活動測定
- 話者クラス音響モデルを用いた講演音声認識の性能向上(音響モデル,認識,理解,対話,一般)
- 音素モデルを用いた話者ベクトルに基づく話者識別の検討(第8回音声言語シンポジウム)
- 音素モデルを用いた話者ベクトルに基づく話者識別の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音素モデルを用いた話者ベクトルに基づく話者識別の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声認識のための確率文脈自由文法に基づく言語モデルの構築と評価(音声情報処理 : 現状と将来技術論文特集)
- 確率文脈自由文法を用いた言語モデルの構築と音声認識実験による評価
- ImageJの声道断面積関数抽出プラグインの開発(音声一般・生成,合成,生成,韻律,音声一般)
- 左右の梨状窩の音響的相互作用(音声一般・生成,合成,生成,韻律,音声一般)
- 側音化構音の知覚と物理関連量
- 側音化構音の音響特性について
- 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討 (音声言語情報処理)
- 大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討
- 大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討
- 大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討
- 連続/セミ連続分布型HMMによる単語音声認識のViterbi best-firstサーチにおける推定スコア設定法の検討
- 状態クラスタリングによるHM-Netの構造決定法の検討
- 状態クラスタリングによるHM-Netを用いた大語彙連続音声認識システムの検討
- 音素連接HMMを用いた尤度正規化に基づくワードスポッティングの検討
- 音素連接HMMを用いた尤度正規化に基づくワードスポッティングの検討
- 状態クラスタリングによるHM-Netの構造決定法の検討
- 状態クラスタリングによるHM-Netの構造決定法の検討
- 音素連接HMMを用いた尤度正規化に基づくワードスポッティングの検討
- 状態クラスタリングによるHM-Netの構造決定法の検討
- 音素決定木に基づく逐次状態分割法によるHM-Netの検討
- 音素連接HMMに基づく尤度正規化を用いたワードスポッティングの検討
- 状態クラスタリングによるHM-Netの構造決定法の検討
- 音素決定木に基づく逐次状態分割法による HM-Net の性能改善の検討
- 音素決定木に基づく逐次状態分割法によるHM-Netの性能改善の検討
- 音素決定木に基づく逐次状態分割法によるHM-Netの性能改善の検討
- 大語彙言語データベースからのN-gram構築とタスク適応の検討
- 離散混合分布HMMのヒストグラム同等化を用いたコードブック正規化(認識・理解・対話・一般)
- 発音変形依存モデルを用いた講演音声認識(音声,聴覚)
- 離散混合分布型HMMによる講演音声認識の検討(多言語, CSJ, 認識・理解・対話・一般)
- ETSI標準フロントエンドを用いた雑音下音声認識の検討(認識・理解・対話)
- ETSI標準フロントエンドを用いた雑音下音声認識の検討(認識・理解・対話)
- 離散混合出力分布型HMMを用いた非定常雑音下の音声認識(ポスターセッション)(第5回音声言語シンポジウム)
- 離散混合出力分布型HMMを用いた非定常雑音下の音声認識(第5回音声言語シンポジウム : ポスターセッション)
- 離散混合出力分布型HMMを用いた非定常雑音下の音声認識(第5回音声言語シンポジウム : ポスターセッション)
- 講演音声認識における音響・言語モデルの話者適応の検討(認識・理解・対話)
- MAP推定を用いた離散混合出力分布型HMMの雑音重畳音声での評価(認識・理解・対話)
- かな・漢字文字列を単位とした言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- かな・漢字文字列を単位とした言語モデルの検討
- 単母音の話者識別に寄与するスペクトル包絡成分
- 連続音声中の母音の話者識別におけるスペクトル包絡と基本周波数の役割
- 単純類似度法による話者識別に適した周波数帯域の検討
- WWWブラウザを利用した日本語読解支援システム
- 話者識別に寄与するスペクトル包絡の成分について
- 話者識別に寄与するスペクトル包絡の成分について
- スペクトル包絡と個人性判断の関係
- 個人性情報を含む周波数帯域について
- スペクトル高域成分の変形と話者識別
- 音声のスペクトル包絡に含まれる個人性について
- かな・漢字文字列を単位とした言語モデルの検討
- 音素グラフに基づく仮説制限法を用いた大語彙連続音声認識の検討
- 確率文脈自由文法を用いたHMM-LR文節音声認識におけるViterbi best-firstサーチの検討
- 確率文脈自由文法を用いたHMM-LR文節音声認識におけるViterbi best-firstサーチの検討
- HMM-LRによる文節音声認識におけるViterbi-best firstサーチの検討
- MRIに基づく音声生成の研究手法の概要
- VQひずみに基づく推定コストを用いるDP best-firstサーチの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 単語グラフ生成におけるパラメータ最適化の検討
- 単語グラフ生成におけるパラメータ最適化の検討
- 単語グラフ生成におけるパラメータ最適化の検討
- SP2000-26 単語グラフ生成の言語重み・挿入ペナルティ最適化の検討
- SP2000-19 話者照合におけるMLLRベースの話者モデル作成の検討
- MLLR適応におけるMDL基準に基づく回帰クラスタ設定の検討
- 尤度差に基づくn-gram言語モデル評価のための指標
- コミュニケーションロボットii-1号の制作
- 音素決定木に基づく逐次状態分割法によるHM-Netの検討
- 連続分布型HMMによる単語音声認識におけるViterbi best-firstサーチの検討
- 係り受け文法による確率文脈自由文法を用いた言語モデルの検討
- 話者照合における話者モデルのMLLR適応の検討
- 話者照合における話者モデルのMLLR適応の検討
- 検索エンジンを用いた主格省略文の自動判定
- 学習者にとって難解な構文の自動検出
- 読解教材の作り込みを支援するツールe-chutaの開発
- 日本語読解支援システムの検証 : MITにおけるアンケート結果の報告
- コミュニケーションロボット同士による漫才
- 日本語文章における主格省略の自動検出
- 母音の調音の方言差 : MRI画像による検討
- 単語難易度判定機能を有するエディタの開発
- WWWブラウザを利用した日本語読解支援システム
- 破裂子音および摩擦子音発声時の声道容積変化の計測(一般セッション,福祉と音声処理,一般)
- アウトボードの音響特性がオーディオ聴取に与える影響の調査
- 基本周波数のシフトが個人性知覚に及ぼす影響
- アウトボードの音響特性がオーディオ聴取に与える影響の調査 (応用音響)
- ATR音声データベースセットCの文音声の個人性類似度(学生ポスターセッション,音声アプリケーション,一般)
- 日英母語話者による英語弱化母音の音響・調音特徴 : X線マイクロビームデータベースに基づく分析
- 基本周波数のシフトが個人性知覚に及ぼす影響
- アウトボードの音響特性がオーディオ聴取に与える影響の調査