雑音下の連続音声中からのキーワード検出

概要

論文の詳細を見る
実雑音下での連続音声中からのキーワード検出について述べる.背景雑音を伴う孤立単語音声認識のロバスト性向上に有効であった複合類似度をベースとしたワードスポッティングにおける雑音免疫学習を,不用意に発話された不要語を伴う雑音下の単語音声,更には雑音下の連続音声に対応できるように拡張した.キーワード検出のための認識辞書作成の際には,不要語および雑音の重畳した学習用音声データを合成し,ワードスポッティングによる学習用単語特徴ベクトル抽出時に,各単語境界の音韻環境を考慮した制約条件を設けることで抽出精度の向上を図り,高精度の認識辞書作成を可能とした.また各単語の複合類似度値の分布を推定し,類似度値を確率的尺度に変換して,キーワード検出の付加・脱落の調整を行った.検出対象としたキーワード30単語を含む100文を成人男性2名が発声した連続音声データに対してキーワード検出実験を行い,類似度を尺度とし孤立単語データで学習する従来の方式と本方式の性能を評価した.従来法ではSN比15dBの環境で,キーワード検出率84.0%(39.3False Alarms/Hour/Word),本方式ではキーワード検出率91.2%(22.7FA/H/W)の結果が得られ,本方式の有効性が確認された.
社団法人電子情報通信学会の論文
1993-03-25

雑音下の連続音声中からのキーワード検出

スポンサーリンク

概要

著者

関連論文

スポンサーリンク