GIF-SP : 汎用・識別的な特徴量を用いた音声認識性能の改善(耐雑音処理,第13回音声言語シンポジウム)

スポンサーリンク

概要

論文の詳細を見る
本稿では,パターン認識一般に広く適用できる識別的な特徴量GIFを提案する.本稿で提案する特徴量抽出手法では,入力ベクトルから中間ベクトルを経由する二段階の変換で,認識用の特徴量に変換する.第一段階の変換は,クラスごとの識別器を構築し,これに基づいて作成する.第二段階の変換は,クラス間の分散を最大化しつつ,直交化と次元圧縮を行う.これらの変換は,学習データを用いて遺伝的アルゴリズムによって決定する.本稿の特徴量GIFについて,音声認識性能評価基盤コーパスを用いて音声認識実験を行った.その結果、雑音環境下を中心に大幅な性能改善に成功し,本手法の有効性が確認された.
2011-12-12

著者

関連論文

もっと見る

スポンサーリンク