単語音声認識における音素信頼度ゆう度を用いた未知語のリジェクション
スポンサーリンク
概要
- 論文の詳細を見る
音声認識の実際的な使用においては, 語彙(い)外発声に対する適切な処理が重要である.代表的なリジェクト方法として, 語彙に応じ, anti-keywordモデルを作成, ゆう度正規化に用いるものがある.これにはタスク依存性があり, 大語彙タスクや語彙が切り換わるタスクでは実現が困難である.これに対し, タスクに独立な方法は, 語彙制約のない音声認識系を並列に動作させ, ゆう度正規化を行うものである.しかし, 語彙制約なし認識系の精度が一般に低いため, リジェクト性能にも限界がある.そこで, 本研究では, タスク独立で高精度なリジェクト方法を目標に, 語彙制約なし認識系によるゆう度正規化に加え, 各音素におけるゆう度の分布差を利用し, 部分区間での照合を導入する.探索時にその差に応じて累積音響ゆう度に重み付けすることで, 各音素での照合精度を向上させる.実験により, 等誤り率において音素信頼度ゆう度を用いない場合に比べ, 認識率を4%改善できた.更に, 識別誤り最小化学習(MCE), gender modelを用いることで, よりリジェクト精度を向上できることができた.また, 音素信頼度ゆう度は, MCE学習の場合, 特に改善効果があることがわかった.
- 社団法人電子情報通信学会の論文
- 2000-02-25
著者
-
相川 清明
Ntt ヒューマンインタフェース研究所
-
高橋 敏
日本電信電話株式会社,NTTサイバースペース研究所
-
實廣 貴敏
NTT ヒューマンインタフェース研究所
-
高橋 敏
NTT ヒューマンインタフェース研究所
-
高橋 敏
日本電信電話株式会社 Nttサイバースペース研究所
-
高橋 敏
日本電信電話株式会社nttサイバースペース研究所
関連論文
- FMニュ-ロンモデルに基づく音声認識のための距離尺度
- 教師なし話者適応のための教師信号選択の高精度化
- フレーム間相関を利用した音韻 HMM による音声認識
- 音声デザインツールSesign
- ハイブリッドスケーラブル型音声合成方式
- 単語の文脈一貫性と音響尤度を用いた音声ドキュメント認識信頼度の推定(認識,理解,対話,一般)
- 韻律的特徴と対話的特徴を用いた怒り通話音声の抽出(認識,理解,対話,一般)
- 単語音声認識における音素信頼度ゆう度を用いた未知語のリジェクション
- 話者照合機能を備えた音声秘書システム
- 音素信頼度尤度を用いたリジェクションの高精度化
- 公衆電話音声に対する音声認識性能評価
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 微小区間スペクトル法を用いた不特定話者音声認識
- 語学訓練のためのHMM音声認識を用いた発声評価尺度
- 音声対話における属性情報・認識誤りフィードバックの効果
- 部分的尤度分布の差に着目した未知語のリジェクション
- 電話サービスを想定した話者照合
- 音声対話における属性情報・認識誤りフィードバックの効果
- 自動音声認識の現状と臨床応用の将来性
- 微小スペクトルに基づくスペクトル推定
- 平均対話回数を用いた対話設計方法
- テレホンバンキング本人確認の研究
- 雑音の統計的分布を用いた音声区間検出
- 音声対話構築のための一評価基準
- VQコードのBigramで制約した音韻HMMによる音声認識
- 音響モデルの分布数削減のための混合重み係数を考慮した分布間距離尺度(研究速報)
- ケプストラム正規化の実行単位に関する実験的検証(研究速報)
- コンタクトセンタ向け音声処理技術の展開 (特集 コンタクトセンタ業務に革新をもたらす音声処理技術)
- 学習移動ベクトルの相関関係を用いた音響モデルの話者適応化
- 4階層共有構造の音響モデルによる音声認識
- 音声認識エンジンREXの開発
- 雑音適応におけるTaylor展開の2次微分項の導入による効果
- 離散混合分布型HMMにおける量子化方法の検討
- Jacobian適応法による雑音適応の性能評価
- Jacobi行列を用いた音響モデルの適応アルゴリズム
- 音声認識のための音響モデルの構造
- Taylor展開による音響モデルの適応
- Taylor展開による音響モデルの適応
- Taylor展開に基づく高速な音響モデル適応法
- スペクトルサブトラクションとNOVO合成を用いた雑音下音声認識
- 語彙制約なし音声認識における識別誤り最小化学習の検討
- 音響モデルのタスク適応における学習データに関する検討
- 周波数変化音追跡モデルに基づくスペクトル予測法
- ON型ニュ-ロンモデルによる音素境界検出 (音声処理・音場制御技術の研究)
- 音声認識における新しい高速化
- 語彙制約なし音声認識における音節継続時間長制御の効果
- 音素HMMの特定タスクへの適応
- 音節継続時間制御の語彙制約なし認識系での検討
- スペクトルの動的および静的特徴量を用いた言語音声の検出
- マイクロホンアレーを用いた音声認識収音系の基礎検討
- スカラー量子化による4階層共有構造HMMの高速計算
- 離散混合出力分布型HMM
- NOVO合成法を用いたBarge-in音声の認識
- 学習移動ベクトル間の相関によりtyingした音響モデルの共有構造
- 4階層共有構造音素モデルにおける分散値共有化の効果
- 典型的な応対フレーズ検出に基づく高精度用件フェーズ抽出手法(音声・音響一般,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 学習移動ベクトル間に相関を持つ音響モデルの共有構造
- 音声認識の音響モデルにおける高精度,高効率モデル化方式 (インタラクティブな音声インタフェ-スの実現を目指して)
- 4階層共有構造の音素HMM
- 4階層共有構造の音素HMM
- HMMによる音声認識 : モデルの表現能力と頑健性
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測(音声合成,第13回音声言語シンポジウム)
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測(音声合成,第13回音声言語シンポジウム)
- 単語の文脈一貫性を用いた音声ドキュメント認識信頼度の推定
- 単語の文脈一貫性を用いた音声ドキュメント認識信頼度の推定
- 発話の時間的関係性を用いた対話音声からの怒り感情推定(ヒューマンコミュニケーション基礎,ヒューマンコミュニケーション〜人にやさしい情報通信社会を実現するコミュニケーション技術〜論文)
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測
- テキストからの表現豊かな音声合成のための句末上昇ラベル予測における句末コンテキストの利用
- テキストからの表現豊かな音声合成のための句末上昇ラベル予測における句末コンテキストの利用
- 文脈類似度と認識信頼度に基づく音声認識辞書の自動語彙適応(言語モデル・音声対話)
- 発話の時間的関係性を用いた対話音声からの怒り感情推定