電話音声データコーパスとそれを用いた不特定話者認識システムの性能について
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、まず初めに電話回線を経由して800人から収集した音声データコーパスについて述べる。次に収集したコーパスを用いて行った2つのタイプの不特定話者音声認識システムの比較実験の結果について報告する。1つの音声認識システムは通常の混合連続型HMMを用いたものであり、もう一つの音声認識システムは、ガウス分布の確率演算量を通常の混合連続型HMMの30分の1まで低減させた2064個のガウス分布の木構造を有するHMMを使用したものである。実験の結果、ガウス分布の木構造を有するHMMを用いた認識システムの性能は通常の混合連続型HMMを用いた認識システムの性能に比べて認識率において約3%以内の劣化に収まった。
- 社団法人電子情報通信学会の論文
- 1994-11-25
著者
関連論文
- B-6-45 高信頼IVRサービスのためのAsteriskを用いたセッションフェールオーバ実現法(B-6.ネットワークシステム,一般セッション)
- PARCOR音声合成技術とその応用
- 時間長モデルを用いた自動ラベリング
- 波形合成における素片辞書構成法
- 日本文音声出力システムの音声処理 (日本文音声出力システム)
- 音声ファイル作成システム
- 小形音声応答装置
- 顔画像と音声を用いた個人認証方式
- 局所的音響情報を用いて合成した背景話者モデルに基づく話者照合(音声情報処理 : 現状と将来技術論文特集)
- 話者照合における背景話者モデル構築方法の比較
- 話者照合におけるHMMの局所的音響情報に基づく尤度正規化
- 話者照合におけるHMMの局所的音響情報に基づく尤度正規化
- 話者照合におけるHMMの局所的音響情報に基づく尤度正規化
- HMMの局所的音響情報を用いたコホート生成に基づく話者照合
- 複数の正規化尤度を複合的に用いた音声認識結果の信頼度算出法(認識, 信頼度)
- D-14-15 段階的信頼度を用いた音声認識結果の信頼度算出法(D-14. 音声・聴覚, 情報・システム1)
- 電話音声認識におけるHMM分解・合成法の性能評価
- 電話音声認識による資金移動サービスと対話の評価(次世代ヒューマンインタフェース・インタラクション)
- 音響モデル空間とケプストラム空間の一致による乗算性歪みの補償
- 電話音声認識における特徴量の正規化
- 携帯電話を経由した音声の認識評価
- ガーベージモデルを用いたキーワード抽出
- ホームバンキングを想定した電話音声認識に関するアンケート
- ホームバンキングを想定した電話音声認識の評価
- 電話音声認識装置における資金移動サービスシステムの評価
- 電話音声認識ハードウエアの開発
- 電話音声データコーパスとそれを用いた不特定話者認識システムの性能について
- 日英シームレス音声認識技術による航空路管制音声認識(音声,聴覚)
- 日英シームレス音声認識技術による航空管制音声認識(音声・音響処理)
- 日英シームレス音声認識技術による航空管制音声認識(音声・音響処理)
- 統計的音響モデルに基づく年代と性別の識別に関する検討
- 複数の認識器を選択的に用いる音声認識システムのためのスコア補正法(音声,聴覚)
- 顔と音声のスコア統合による個人認証
- 複数モデルを選択的に用いる音声対話システムにおけるドメイン切り替え尺度の検討
- 音声対話システムにおけるドメイン識別の検討
- 音声対話システムを用いた車内対話の収集
- 電話音声における未学習単語の認識性能について
- 音声対話モニタリングによる対話の知的支援機構の検討
- NGNにおけるみなし音声によるFAX通信の品質に関する評価
- バーチャル・エンタープライズ
- コードブックに基づく話者照合しきい値の決定方法
- 音声認識における背景雑音の影響
- メディア変換技術の最新動向-5-音声合成技術
- メディア変換技術の最新動向-4-音声認識技術
- PARCOR形画面別音声ファイル装置
- PARCOR形画面別音声ファイル作成法
- B-6-75 OpenFlowを活用したクラウド基盤ネットワークの実現(B-6.ネットワークシステム,一般セッション)