連続音声認識のためのスポッティングに基づく新しい接近法 : 最小誤りキーワード列分類
スポンサーリンク
概要
- 論文の詳細を見る
To overcome the lack of theoretical basis of a fundamental, word spotting-based approach to the recognition of natural, spontaneous speech utterances, we propose in this paper a novel spotter (spotting system) design method referred to as Minimum Error Classification of Keyword-sequences (MECK). A key concept of the method is to formalize the entire spotting process as a trainable functional form with the design objective being the keyword-sequence (a string of prescribed keyword categories) classification accuracy. A resulting MECK procedure allows one to design spotters in an efficient way of using only pairs of utterances and their corresponding phonemic transcriptions (not requiring hand-segmented labels) as well as in a mathematically-proven way consistent with the error minimization of the keyword-sequence classification. MECK is quite general and can be applied to any reasonable spotter structure. The paper specially presents implementation details for a prototype-based spotter and demonstrates the utility of this MECK-trained spotter in several Japanese keyword spotting tasks.
- 社団法人日本音響学会の論文
著者
-
片桐 滋
Atr人間情報通信研究所
-
片桐 滋
Atr Auditory And Visual Perception Research Laboratories
-
小森 隆
Atr Human Information Processing Research Laboratories
-
片桐 滋
ATR Interpreting Telecommunications Research Laboratories
関連論文
- インターネットを利用した音声のききとり公開実験の試み (2) : 実験室実験との比較による公開実験結果の信頼性の検討
- インターネットを利用した音声のききとり公開実験デモ
- インターネットを利用した音声のききとり公開実験の試み(1) : システムの構築に関する技術的検討と稼働状況
- LVQ-HMM混合アルゴリズムの再評価
- 識別的特徴抽出に基づく話者認識 : メルケプストラム特徴の最適化
- 識別的特徴抽出に基づく話者認識 -2次オールパス関数に基づくメルケプストラム特徴の最適化-
- 一般化確率的降下法を用いる信号検出法
- 音声認識のための最小歪分節化/LVQ混合アルゴリズム
- わかりやすいパターン認識, 石井健一郎, 上田修功, 前田英作, 村瀬 洋(共著), "わかりやすいパターン認識", オーム社(1998-08), A5判, 定価(本体 2,800円+税)
- 一般化確率的降下法を用いるパターン認識
- 連続音声認識のためのスポッティングに基づく新しい接近法 : 最小誤りキーワード列分類
- 23rd European Microwave Conference (23rd EuMC)
- 音声認識のための識別訓練入門