VLSI Architecture of GMM Processing and Viterbi Decoder for 60,000-Word Real-Time Continuous Speech Recognition
スポンサーリンク
概要
- 論文の詳細を見る
We propose a low-memory-bandwidth, high-efficiency VLSI architecture for 60-k word real-time continuous speech recognition. Our architecture includes a cache architecture using the locality of speech recognition, beam pruning using a dynamic threshold, two-stage language model searching, a parallel Gaussian Mixture Model (GMM) architecture based on the mixture level and frame level, a parallel Viterbi architecture, and pipeline operation between Viterbi transition and GMM processing. Results show that our architecture achieves 88.24% required frequency reduction (66.74MHz) and 84.04% memory bandwidth reduction (549.91MB/s) for real-time 60-k word continuous speech recognition.
論文 | ランダム
- 火力発電の最適投入と運用に関するシステム分析 : 火力発電方式組み合わせによるCO_2低減
- 石川県下のRDFシステムにおけるLCA分析 : その2. RDF施設運営に関するLCA分析
- 植物成長への電気回路網理論の応用 : その2 葉緑素間の電子移動によるエネルギー伝達過程の回路化
- 植物成長への電気回路網理論の応用 : その1 植物細胞内での電子移動に伴う微弱電磁波の解析
- 石川県下におけるRDF施設のLCA分析 : その1. RDF製造施設におけるLCA分析