ランダムプロジェクションを用いた音声特徴量変換(音響モデル,認識,理解,対話,一般)

スポンサーリンク

概要

論文の詳細を見る
本稿では、ランダムプロジェクションを用いた音声特徴量変換を提案する。ランダムプロジェクションとは,次元削減の手法として従来用いられており、高次元空間における任意の2点間のユークリッド距離が射影先の低次元空間においてもほぼ保存される,という性質を持つ空間写像の一手法である.ランダムプロジェクションで用いる写像行列は,各成分が独立にある確率分布に従うランダムなn×k行列として定義される.本稿では,複数のランダムマトリックスを用いて機械的に音声特徴量を変換し,各々のランダム写像に対する音声認識結果に投票を行い,最適な認識結果を求める.評価はCENSREC-3で行い,その有効性を示す.
社団法人電子情報通信学会の論文
2009-07-10

著者

関連論文

もっと見る

スポンサーリンク