多次元尺度法を用いた統計的音響モデルの可視化手法(音声,聴覚)

スポンサーリンク

概要

論文の詳細を見る
本論文では,統計的音響モデルの集合を可視空間に写像することで,音響空間の広がりを把握する可視化手法を提案する.実験では,発話様式の異なる複数の話者からなる音声コーパスを用いて作成された,特定話者音響モデル群の可視化を行い,発話様式ごとに特定話者音響モデル群の分布が形成されることを確認した.主成分分析法やSOM法等の従来の可視化手法との比較実験では,各発話様式の分布の分離度を比較し,高い分離度が得られることを確認した.また,提案手法による可視化の例として,年代,性別,信号雑音比依存の音響モデル群や,音声群と非音声(非定常性雑音)群の統計的音響モデルの二次元空間への写像結果を紹介し,年代,性別,信号雑音比,音声及び非音声の違いにより,音響空間上での配置や形状が異なることを確認した.
社団法人電子情報通信学会の論文
2008-11-01

著者

関連論文

もっと見る

スポンサーリンク