少数の音声データによる音声標準パタン作成方法
スポンサーリンク
概要
- 論文の詳細を見る
離散単語音声認識において高性能な認識を実現させるためには、単語ごとの音声波形の特徴を十分に表現させた、良好な音声標準パタンを作成する必要がある。音声標準パタンは、実際に収集した多数の音声データをクラスタリング化・平均化することにより作成される。しかし従来の音声標準パタン作成方式では、数百~千人程度もの多数の音声データを収集しなければ単語ごとの発音・発声スピード・ゆらぎ等の発声個人差を的確に表現させることができず、非常に多大な労力を費やしていた。以下本論ではこのような問題点を解決させる一手法として、音声データの正規性の検定結果に基づき、統計的な推定手法を用いることによって数十人の少数の音声データから良好な音声標準パタンを作成させる方式を開発したので、その方式と評価結果について述べる。
- 一般社団法人情報処理学会の論文
- 1993-09-27
著者
関連論文
- バイオメトリクスの精度評価
- 夢の実現--昨日、今日、明日 アイリス認識装置開発物語 (先端ビジネス特集)
- アイリス個人識別システム (金融システム特集)
- アイリス認識技術とその応用 (特集 最近のほんもの確認技術)
- 目のバイオメトリクス
- 音声インタ-フェ-スを用いた大規模呼出システム (ヒュ-マンインタフェ-ス)
- 少数の音声データによる音声標準パタン作成方法
- 停電管理マッピングシステムの開発
- 電力運用における音声インターフェースの性能評価
- 区間管理方式を用いた効率的な配電系統運用