発声制約の緩和を可能にするサーチの検討

概要

論文の詳細を見る
単語音声認識システムの利用者は, 例えば「すずき」ではなく「す」「ず」「き」のように音節単位で発声をする場合がある。しかし, 単語単位での発声入力を前提としている従来の単語音声認識システムでは, 音節単位での発声を許容しないために, 認識性能に著しい劣化が生じることになる。そこで本報告では, 発声形態の制約を緩和し, 様々な発声形態による入力音声に対して認識性能を回復できるサーチ手法として, 累積尤度方式を提案する。累積尤度方式は, 照合処理において, 音節単位のような部分的な発声の終端が検出される毎に, 照合データの一部を次の音声入力まで保持することにより, ポーズで分割された音節単位発声の単語音声や, 一息では言いづらい長い単語の音声に対応する。人名100語の認識タスクでの評価の結果, 従来の単語単位の発声形態を前提とした方式では全く正解が得られない入力音声に対して, 71%の認識率が得られ, 提案方式の効果が実証できた。
一般社団法人情報処理学会の論文
1998-02-05