2次元可視化手法に基づいた音響空間分割による音響モデルライブラリの開発
スポンサーリンク
概要
- 論文の詳細を見る
多次元特徴パラメータのHidden Markov Model(以下HMM)により表現される音響モデルの相互距離に基づいて,複数の音響モデルを2次元の音響空間地図上に写像する可視化手法(COSMOS法:aCOustic Space Map Of Sound[1], [2], [3], [4])を用いて,音響空間を部分音響空間に分割し,部分音響空間毎に音響モデルを作成することにより,詳細化された複数の音響モデル(以下音響モデルライブラリ)を構築する手法について述べる.未知の話者を少数の音声サンプルから,その話者の属する部分音響空間を同定することにより,高性能で,かつサイズの小さい音響モデルを提供する技術の検討を行う.本稿ではまず,COSMOS法により,男性話者145名の複数の発話様式による音声データ(のべ561名)の音響空間地図を作成し,発話様式毎の分布,音響空間地図上の話者の位置と認識性能との関係について分析を行い,COSMOS法が音声データベースの分布に有用であることを示す.次に,音響空間地図を同心円状に部分音響空間に分割し,部分音響空間毎に単一正規分布で表現される音響モデルを構築する.構築された音響モデルの集合である音響モデルライブラリから,評価話者の5単語の音声サンプルに対し,最大尤度を与える音響モデルを選択し,認識に用いたところ,正規分布の混合数16の不特定話者音響モデルと同程度の性能を示し,評価話者の30単語の音声サンプルを用いてMLLR[6]により適応化された話者適応モデルを上回る性能を示した.
- 社団法人電子情報通信学会の論文
- 2004-07-16
著者
-
庄境 誠
旭化成株式会社新事業本部
-
庄境 誠
奈良先端科学技術大学院大学
-
庄境 誠
旭化成株式会社音声ソリューションビジネス推進部
-
庄境 誠
旭化成株式会社 情報技術研究所
-
奈木野 豪秀
旭化成株式会社音声ソリューションビジネス推進部
関連論文
- 音声認識実用化技術の展開(総合報告)
- 3 使い勝手の良い音声インタフェースの実現(音声認識技術の実用化への取り組み)
- 音声HMI技術・製品の品質の計測,評価,保証
- [パネルディスカッション]音声認識技術がキャズムを越えるには?
- 第5回SLPデベロッパーズフォーラムイベント企画の趣旨について〜コーディネータの立場から〜
- 人間の多様な振る舞いを考慮した音声UIの必要性
- 音声認識実用化技術の展開
- 浴室向け音声コントローラの開発(応用システム)
- 浴室向け音声コントローラに用いる音響モデルの開発(応用システム)
- 鉄道分野における音声・音響センサの応用
- 複数音声コーパスの俯瞰的分析(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 複数音声コーパスの俯瞰的分析(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 複数音声コーパスの俯瞰的分析(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- コーパス, モデリング, ベンチマークのあるべき姿(パネルディスカッション「音声認識技術の実用化」)
- 赤外線センサにHMMを適用した物体の認識手法(位置情報とセンサ応用)
- 赤外線センサにHMMを適用した物体の認識手法(位置情報とセンサ応用)
- 特許から見た音声認識ビジネスの動向 : 平成14年度特許庁特許出願技術動向調査分析に見る音声認識の特許動向(音声認識のビジネス動向)
- 特許から見た音声認識ビジネスの動向 : 平成14年度特許庁特許出願技術動向調査分析に見る音声認識の特許動向
- 多数音声コーパスより作成された音響空間地図の作成と音響モデルライブラリの構築
- COSMOS法を用いた効率的な音声コーパスの構築
- 2次元可視化手法に基づいた音響空間分割による音響モデルライブラリの開発
- 多次元尺度構成法による音響空間の2次元可視化(音声・音響処理)
- 多次元尺度構成法による音響空間の2次元可視化(音声・音響処理)
- 多次元尺度法を用いた統計的音響モデルの可視化手法(音声,聴覚)
- 2. 実環境で雑音と音声を聞き分ける(見分ける,聞き分ける)
- フレームワイズな音声検出に基づく適応フィルタを利用した自動車内でのロバスト音声認識
- 正規分布の逐次適な適応化手法による話者適応の効果について
- 音声強調手法E-CMN/CSSの自動車環境内での音声認識における評価
- 音響エコーキャンセラによる車室内音声認識性能の改善 ( 音響信号処理による音声認識性能の改善)
- ケプストラム平均正規化法とHMM合成法に基づくモデル適応化法E-CMN/PMCと自動車内音声認識への適用
- キーワードスポッティングに対する話者適応の効果に関する検討
- 音響エコー/加法性雑音/乗法性歪みが存在する自動車内でのロバスト音声認識
- 自動車内での音声認識における音声強調手法とモデル適応化手法の比較検討
- 音声認識における音声強調手法及びモデル適応化手法の検討
- 鉄道分野における音響センサの可能性
- 自動車運転行動中発話の分析(音声認識実用化に向けて)
- 音声言語情報処理技術デベロッパーズフォーラムの開催にあたり(特別企画「音声認識デベロッパーズフォーラム」)
- 音響認識の鉄道分野応用の検討
- これからの音声 〜技術の実用的利活用〜