音声の構造的表象に基づく日本語孤立母音系列を対象とした音声認識(音声,聴覚)

スポンサーリンク

概要

論文の詳細を見る
音声には話者の声道形状の特性,音響機器の特性などの非言語的特徴が不可避的に混入する.近年,これらを表現する次元を原理的に保有しない音響的普遍構造が提案されている.これは,音声事象の物理的実体を捨象し,関係のみをとらえることによって得られる音声の構造的表象である.この構造を音声認識において利用することを目的として,日本語孤立母音系列をタスクとする不特定話者音声認識に関する基礎検討を行った.クリーン音声を対象とした認識実験を行った結果,提案手法は音声の物理的実体を明示的に用いずに,学習話者1名で不特定話者の母音系列を100%の性能をもって認識することに成功した.また雑音重畳音声に関しては,雑音下で学習した学習話者1名の提案手法が,SS (Spectral Subtraction)及びCMN (Cepstral Mean Normalization)を用いた学習話者4,130名の従来手法を上回る結果が得られた.
社団法人電子情報通信学会の論文
2008-02-01

著者

関連論文

もっと見る

スポンサーリンク