条件付きエントロピー最小化基準に基づくマルチカーネル学習を用いた発話スタイル変動に頑健な話者照合
スポンサーリンク
概要
- 論文の詳細を見る
話者内変動に頑健な話者照合システムについて検討を行った.発話スタイルや発話時期の違いなどの影響で,同一話者の音声であっても音響的な変動が生じる.このような音響変動は,一般的に話者照合システムの性能を劣化させることが知られている.この問題を解決するため,条件付きエントロピー最小化という,同一クラスのデータを密集させ,かつ異なるクラスのデータを互いに遠ざける性質を持つ最適化基準を用いてマルチカーネル学習を行い,話者照合システムを構築することを試みた.話者照合実験の結果,提案システムは,従来のマージン最大化に基づき構築したシステムと比較して,発話スタイル変動に起因する話者クラス内での音響特徴変動に対して頑健な性能を与えた.
- 2011-07-14
著者
-
小林 哲則
早稲田大学理工学術院
-
日野 英逸
(株)日立製作所システム開発研究所
-
日野 英逸
早稲田大学
-
村田 昇
早稲田大学
-
小川 哲司
早稲田大学
-
村田 昇
早稲田大学先進理工学部
-
小林 哲則
早稲田大学情報理工学科
-
小林 哲則
早稲田大学理工学部電気電子情報工学科
-
小林 哲則
早稲田大学
-
日野 英逸
早稲田大学先進理工学部電気・情報生命工学科
-
小川 哲司
早稲田大学高等研究所
-
村田 昇
早稲田大学先進理工学部電気・情報生命工学科
-
小林 哲則
早稲田大学理工学術院情報理工学科
関連論文
- 音声認識実用化技術の展開(総合報告)
- 複数情報の統合による人物の性別・年齢層の推定法(顔とジェスチャの認識)
- クラス距離を重みとする局所保存射影とその顔画像による年齢推定への応用(テーマ関連セッション2)
- 会話ロボットとその聴覚機能
- 音声シフト : 音高の意図的な変化を利用した音声入力インタフェース(音声, 聴覚)
- 音声シフト : "SHIFT"on Speech
- I-062 監視カメラ映像からの実時間顔検出手法の一検討(I.画像認識・メディア理解)
- 複数情報の統合による人物の性別・年齢層の推定法
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 集合知に基づく語彙情報を用いたトピック依存言語モデリング(理解)