信頼度尺度に基づく音声認識誤りの検出および誤り訂正(合成, 韻律, 生成, 一般)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,N-gramでは表現できない広範囲の文脈に依存した言語知識をモデル化するために,用例文を用いた新しい言語モデルである用例文モデルの提案を行う.用例文モデルでは収集された用例文の中から,最も単語列および音順列の近いものが候補として選択される.この後,N-gramでの認識結果と用例文モデルでの結果を対応する単語ごとに比較し,N-gramでの認識結果が誤りである可能性が高い単語に対しては積極的に用例文モデルでの結果を採用し,誤りである可能性が低い単語に対しては用例文モデルでの結果が信頼性の高いものである場合のみ用例文モデルでの結果を採用する.この各単語に対する判定に対しては,N-gramでの認識結果から得られる信頼度尺度と,用例文モデルで用いられる単語列および音順列の近さの尺度である編集距離を入力とするサポートベクターマシン(SVM)を用いる.本手法は旅行対話表現集コーパスを用いた実験において約20%の誤認識率の改善が見られ,有効性が確認できた.
- 社団法人電子情報通信学会の論文
- 2003-08-14
著者
-
酒向 慎司
名古屋工業大学大学院工学研究科
-
山本 博史
Nict Atr
-
山本 博史
Atr音声言語コミュニケーション研究所
-
菊井 玄一郎
ATR音声言語コミュニケーション研究所
-
酒向 慎司
名古屋工業大学
-
酒向 慎司
名古屋工業大学大学院工学研究科情報工学専攻
-
酒向 慎司
名古屋工業大学大学院
-
山口 辰彦
ATR音声言語コミュニケーション研究所
-
菊井 玄一郎
Atr音声言語コミュニケーション研究所音声言語処理研究室
-
山本 博司
Atr 音声言語コミュニケーション研究所
関連論文
- A-15-1 コード進行を用いた楽曲のモデル化と楽曲間の類似度に関する研究(A-15.ヒューマン情報処理,一般セッション)
- ストローク間の位置関係の文法記述に基づくオンライン手書き漢字認識(テーマセッション5(オンライン処理),文字・文書の認識・理解)
- 日本語歌詞からの自動作曲(音楽とOR)
- Orpheus : 歌詞の韻律に基づいた自動作曲システム(自動作曲)
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- 早口合成音声の聴取実験によるテキスト音声合成の評価(視覚障害/聴覚障害/一般)
- 第1回 HTSを用いた音声合成システムの構築
- A-15-2 クラシック音楽を対象としたGMMに基づく感性モデルに関する研究(A-15.ヒューマン情報処理,一般セッション)
- 統計的翻訳評価尺度に基づく日英翻訳文の訳質分析(機械翻訳)
- 未知固有表現を含む音声の認識([特別セッション]音声言語獲得・学習技術(2), 未知語処理)
- 複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識(音声、聴覚)
- 連続音声認識システムにおけるfactoringテーブルのコンパクト化と不要単語仮説のガーベジコレクション
- 機械翻訳によって生成された追加テキストを使った統計的言語モデルの適応
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合 : 旅行会話音声における評価
- 文認識率の向上に向けたFSAとNGRAMの併用モデルによる大語彙連続音声認識
- ROVER法を用いた音声認識結果の統合と誤認識文のリジェクション
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 話題と文型の違いを同時に考慮した言語モデル適応
- サブワードモデルを用いた未登録語認識の効率的探索手法(音声言語情報処理とその応用)
- 構造化言語モデルとその実装
- 後続仮説数の管理機能を用いた単語グラフの仮説数削減
- 対話者の前発話を利用した統計的言語モデル
- 音声認識過程での発話分割のための統計的言語モデル(21世紀のグループウェア)
- クラスに依存した語彙の確率的記述に基づく階層型言語モデル
- 2つの単語クラスから生じた未登録語のサブワードモデルによる音声認識
- サブワードモデルを用いた未登録語認識における効率的探索手法
- HMMに基づく人物や動作の多様性を考慮した手話認識手法(聴覚障害者支援ほか,福祉情報工学一般,地域におけるITサポート(シンポジウムテーマ))
- MSD-HMMによる隠れ領域を考慮した手話動作のモデル化
- サブワードネットワークに基づく未登録語処理を搭載したデコーダの構築
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- HMMを用いた手話単語を構成するサブユニットの自動生成手法
- A-10-3 相互相関関数を用いた混合音の音高・楽器推定(A-10.応用音響,一般セッション)
- 韻律生成HMMのための学習データ作成ツール
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- 中国語形態素コーパスと言語モデルの評価 : パラレルコーパスにおける日英両言語との比較
- 音声翻訳のための中国語対話コーパスの整備とその評価(マルチモーダル, コーパス・言語モデル)
- 音声翻訳のための中国語対話コーパスの整備とその評価(マルチモーダル, コーパス・言語モデル)
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 信頼度尺度に基づく音声認識誤りの検出および誤り訂正(合成, 韻律, 生成, 一般)
- パラメータ共有HMMに基づく音響信号からの自動和音認識の検討
- 視聴覚情報を用いた意図推定の為の決定木に基づく意図境界推定
- 楽譜を考慮した演奏者の統計的モデル化手法の改善と演奏者識別による評価
- 単旋律のパート分配によるアンサンブルのための自動編曲手法
- 楽譜情報のコンテキストクラスタリングに基づく演奏者のモデリング手法
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- HMMを用いた日変動パターンに基づく環境電磁波のモデル化と異常検出(信号処理,知的マルチメディアシステム,一般)
- HMMを用いた日変動パターンに基づく環境電磁波のモデル化と異常検出(信号処理,知的マルチメディアシステム,一般)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- D-14-4 骨導音声を用いたGMMに基づく話者識別(D-14.音声,一般セッション)
- A-4-29 HMMを用いた日平均情報に基づく環境電磁波の異常放射検出(A-4.信号処理,一般セッション)
- A-4-30 GMMを用いたケプストラムの日平均情報に基づく環境電磁波の分析(A-4.信号処理,一般セッション)
- A-10-3 GMMに基づく演奏者の音楽的逸脱のモデル化(A-10.応用音響,一般セッション)
- D-12-51 雑音の影響による音声と画像のずれをモデル化したバイモーダル大語彙連続音声認識(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- H-028 GMMを用いた環境電磁波の異常検出と地震のエネルギーとの相関(画像認識・メディア理解,一般論文)
- AS-2-10 SOM上の環境電磁波の特徴(AS-2.電磁波地震予知における信号処理の新展開、評価技術,シンポジウム)
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- A-4-23 手座標追跡によるジェスチャー認識
- HMM に基づく歌声合成のためのビブラートモデル化
- E-037 コード進行クラスタリングによる楽曲のモデル化と楽曲間類似度の評価(自然言語・音声・音楽,一般論文)
- D-12-124 手話単語認識のためのサブユニットHMMの自動生成(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- A-10-4 環境電磁波のケプストラムを用いたベクトル量子化 : コードワードの解析(A-10.応用音響,一般セッション)
- K-019 手話単語を構成するためのサブユニットHMMの自動生成(教育工学・福祉工学・マルチメディア応用,一般論文)
- A-10-8 混合音の調波構造パターンとの相関による楽器・音高推定(A-10.応用音響,一般セッション)
- K-057 HMMに基づく手の動きと形状特徴のストリーム別クラスタリングを用いた手話認識手法(K分野:教育工学・福祉工学・マルチメディア応用,一般論文)
- F-22 HMM歌声合成における音韻・音高の同時モデル化(音楽情報科学(1),F.音声・音楽)
- HMMに基づく歌声合成のためのビブラートモデル化
- E-029 状態共有型HMMに基づく音楽音響信号からの自動和音認識の検討(E分野:自然言語・音声・音楽,一般論文)
- 5T-3 GMMに基づいた楽曲特徴と感性情報の対応関係のモデル化(音楽信号処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 隠れマルコフモデルに基づいた歌声合成システム(音楽情報科学)
- 隠れマルコフモデルに基づいた歌声合成システム(音楽音響信号認識/生成2)
- K-15 HMMを用いたジェスチャー認識における混合数の検討(ヒューマンコミュニケーション基礎(2),K.ヒューマンコミュニケーション&インタラクション)
- HMMに基づいた視聴覚テキスト音声合成 : 画像ベースアプローチ(音声言語情報処理とその応用)
- 複合ウェーブレットモデルに基づく音声の分析合成(福祉と音声処理, 一般)
- 複合ウェーブレットモデルに基づく音声の分析合成(福祉と音声処理, 一般)
- 1T-4 単旋律のパート分配と伴奏・副旋律生成によるアンサンブルのための自動編曲手法(音楽分析・生成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- E-015 発話文における意図識別に有効な音響特徴の検討(E分野:自然言語・音声・音楽,一般論文)
- ストローク単位の確率文脈自由文法を用いたオンライン手書き数式データベースの作成(テーマセッション4(数式),文字・文書の認識・理解)
- ストローク単位の確率文脈自由文法を用いたオンライン手書き数式認識(テーマセッション(3),文字認識・文書理解)
- ストローク単位の確率文脈自由文法を用いたオンライン手書き数式認識(テーマセッション(3), 文字認識・文書理解)
- 実世界環境における視聴覚情報を統合した擬人化対話エージェントシステムの検討
- 1T-7 任意の言葉の印象に合った楽曲生成についての検討(音楽分析・生成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- CRFに基づく伴奏の演奏表現の予測モデルと協調演奏システム
- 手話の音韻構造に基づいたHMM手話認識の改善(聴覚障害ほか,視覚障害者支援,福祉情報工学一般)
- 確率的手法による歌唱曲の自動作曲 (「音楽制作と情報処理の友好関係」特集号)
- 多声MIDI演奏の楽譜追跡における演奏の即興性のモデル化と自動伴奏への応用
- 確率的手法による歌唱曲の自動作曲(音楽制作と情報処理の友好関係)
- E-028 任意の言葉による楽曲検索のための楽曲特徴量の自動選択(E分野:自然言語・音声・音楽)