講演音声認識における教師なし適応の改善(認識,理解,対話,一般)
スポンサーリンク
概要
- 論文の詳細を見る
近年,自然発話に近い大規模な音声データベースを用いて,大語彙連続音声認識が研究されている.本論文では,2004年6月に公開された「『日本語話し言葉コーパス:CSJ』最終公開版」を用いて,教師なし適応の改善を検討した.対角共分散音響モデルと全共分散音響モデルを作成し,音響・言語モデルの繰り返し教師なし適応を検討した.さらに,認識結果に含まれる品詞情報に基づいて適応データの選択や重み付けを検討した.公開版CSJのtestset1により評価した結果,全共分散音響モデルを用いる場合の単語誤り率は適応前19.17%,繰り返し適応後14.73%,さらに適応データ重み付けにより14.55%を達成した.
- 社団法人電子情報通信学会の論文
- 2007-06-21
著者
-
加藤 正治
山形大学大学院理工学研究科
-
小坂 哲夫
山形大学大学院理工学研究科
-
奥山 洋平
(現)富士通(株)
-
好田 正紀
山形大学大学院理工学研究科
-
草間 隆
山形大学大学院理工学研究科
-
奥山 洋平
山形大学大学院理工学研究科
-
好田 正紀
山形大学
関連論文
- 単語グラフ統合を用いた種々の雑音環境下での音声認識 (音声)
- PLSA言語モデル適応におけるアニーリングスケジュールの評価(言語モデル・システム,第10回音声言語シンポジウム)
- SP2000-25 N-gramに基づくエルゴディックHMMによる言語モデル
- Quinphone HM-Netを用いた単語グラフ統合に基づく講演音声認識(音声・言語・音響教育,一般)
- 単語グラフ統合を用いた種々の雑音環境下での音声認識(認識,理解,対話,一般)
- 音声雑音環境下における音声区間検出の検討
- 話者クラス音響モデルを用いた講演音声認識の性能向上(音響モデル,認識,理解,対話,一般)
- 英語発音評定における各種正規化の検討 (音声)
- 英語発音評定における各種正規化の検討 (言語理解とコミュニケーション)
- PLSA言語モデル適応におけるアニーリングスケジュールの評価(言語モデル・システム,第10回音声言語シンポジウム)
- PLSA言語モデル適応におけるアニーリングスケジュールの評価(言語モデル・システム,第10回音声言語シンポジウム)
- 話者ベクトルに基づく話者照合の検討(認識,理解,対話,一般)
- 音素クラスHMMを使用した話者ベクトルに基づく話者識別法の検討(特徴量・音響モデル,第9回音声言語シンポジウム)
- 音素クラスHMMを使用した話者ベクトルに基づく話者識別法の検討(特徴量・音響モデル,第9回音声言語シンポジウム)
- 音素クラスHMMを使用した話者ベクトルに基づく話者識別法の検討(特徴量・音響モデル,第9回音声言語シンポジウム)
- 音素モデルを用いた話者ベクトルに基づく話者識別(音声,聴覚)
- 講演音声認識における教師なし適応の改善(認識,理解,対話,一般)
- 話者ベクトルによる雑音下話者識別の検討(認識,理解,対話,一般)
- 音素モデルを用いた話者ベクトルに基づく話者識別の検討(第8回音声言語シンポジウム)
- 音素モデルを用いた話者ベクトルに基づく話者識別の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音素モデルを用いた話者ベクトルに基づく話者識別の検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- コードブック適応を用いた離散混合分布型HMMによる講演音声認識(音声認識)
- 音声認識のための確率文脈自由文法に基づく言語モデルの構築と評価(音声情報処理 : 現状と将来技術論文特集)
- 英語発音評定における各種正規化の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 英語発音評定における各種正規化の検討
- 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 離散混合分布HMMのヒストグラム同等化を用いたコードブック正規化(認識・理解・対話・一般)
- 発音変形依存モデルを用いた講演音声認識(音声,聴覚)
- 離散混合分布型HMMによる講演音声認識の検討(多言語, CSJ, 認識・理解・対話・一般)
- 離散混合出力分布型HMMによる雑音下音声認識のMFCCでの評価
- ETSI標準フロントエンドを用いた雑音下音声認識の検討(認識・理解・対話)
- ETSI標準フロントエンドを用いた雑音下音声認識の検討(認識・理解・対話)
- 離散混合出力分布型HMMを用いた非定常雑音下の音声認識(ポスターセッション)(第5回音声言語シンポジウム)
- 離散混合出力分布型HMMを用いた非定常雑音下の音声認識(第5回音声言語シンポジウム : ポスターセッション)
- 離散混合出力分布型HMMを用いた非定常雑音下の音声認識(第5回音声言語シンポジウム : ポスターセッション)
- 講演音声認識における音響・言語モデルの話者適応の検討(認識・理解・対話)
- MAP推定を用いた離散混合出力分布型HMMの雑音重畳音声での評価(認識・理解・対話)
- 講演音声認識における話者適応の検討
- 離散混合出力分布型HMMのMAP推定による雑音適応の検討
- かな・漢字文字列を単位とした言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- かな・漢字文字列を単位とした言語モデルの検討
- かな・漢字文字列を単位とした言語モデルの検討
- かな・漢字文字列を単位とした音声認識の検討
- 単語グラフ生成の言語重み・挿入ペナルティ最適化の検討
- 音素グラフに基づく仮説制限法を用いた大語彙連続音声認識の検討
- 音素グラフに基づく仮説制限法を用いた大語彙連続音声認識の検討
- Trigramに基づくErgodic HMMによる言語モデルの検討
- 話者クラス音響モデルおよび話者適応を用いた話し言葉音声認識の検討(認識,理解,対話,一般)
- 声道長正規化による大語彙連続音声認識の性能改善の検討
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 最大エントロピー法によるトリガー言語モデルの評価
- 対話音声認識におけるMLLR適応の評価
- 単語グラフ生成におけるパラメータ最適化の検討
- 単語グラフ生成におけるパラメータ最適化の検討
- 単語グラフ生成におけるパラメータ最適化の検討
- 単語グラフ生成におけるパラメータ最適化の検討
- SP2000-26 単語グラフ生成の言語重み・挿入ペナルティ最適化の検討
- SP2000-19 話者照合におけるMLLRベースの話者モデル作成の検討
- MLLR適応におけるMDL基準に基づく回帰クラスタ設定の検討
- 品詞と高頻度単語のN-gramを使用したタスク適応の検討
- 確率文脈自由文法を用いた言語モデルにおける初期値の検討
- 識別学習を用いた離散混合分布HMMによる音声認識
- 話者クラス音響モデル及び単語グラフ統合を用いた音声認識(音声,聴覚)
- 話者クラス音響モデルを用いた講演音声認識におけるクラスタリング手法の各種検討(ポスターセッション)