1チップDSPで作動する実用的な不特定話者音声認識法
スポンサーリンク
概要
- 論文の詳細を見る
近年,小型の携帯情報機器等の普及に伴い,入力手段として1チップDSP程度で処理できる不特定話者用音声認識技術の開発が急務となっている.今回我々は,既に提案した音素類似度ベクトル法[1]に基づき,計算量・メモリ量の削減,ワードスポッティング法,耐ノイズ性について検討し,100単語の語い数をもち,1チップDSPで処理できる実用向けの不特定話者単語音声認識技術を開発した.音素類似度ベクトル法は,音素類似度値の相対関係を利用しているため,標準パターンの圧縮やパラメータのビット数の削減に極めて有利であることが明らかになり,DSPの内蔵メモリだけですべての認識処理を行うことが可能となった.実環境下でも高い認識性能を得るために,事後確率値の積を用いるワードスポッティング法の検討,および騒音の種類によって音素標準パターンを切り換える方法の検討を行った.これらの結果に基づいて,メモリ内蔵の1チップDSPで100単語が認識できるボードの開発を行った.この認識ボートを用いて,40単語を認識辞書として登録し男女各5名が発声したデータを評価した結果,騒音環境下でも95.3%の良好な認識性能を得ることができた.
- 社団法人電子情報通信学会の論文
- 1996-12-25
著者
-
星見 昌克
松下技研株式会社
-
二矢田 勝行
松下技研株式会社
-
二矢田 勝行
電子情報通信学会:九州工業大学工学部電気工学科
-
山田 麻紀
松下電器・avコア技術開発センター
-
山田 麻紀
松下技研株式会社
-
星見 昌克
松下技研
関連論文
- A*探索を用いた連続音声認識方法の検討
- 音声による文例検索方法の検討
- 未知語の処理方法の検討
- 日英通訳テレビ電話システムの試作
- 単語共起モデルの評価
- 単語タイプライタを用いた文音声認識法における高速化の検討
- 単語共起と単語Bigramによる制約を用いた文認識法の検討
- 共分散共有型HMMにおける計算量削減方法の検討
- セグメント特徴量を用いた実用向けの不特定話者音声認識
- 語彙変更が容易な不特定話者用小型音声認識ボード
- 音素対の線形判別結果を確率論的に統合した音素認識法の検討
- モデル音声法におけるスペクトル歪み対策法の検討
- モデル音声法における話者適応方式の検討
- 音素の特徴点に着目した大語彙不特定話者音声認識法
- 1チップDSPで作動する実用的な不特定話者音声認識法
- 音素の特徴点に着目した不特定話者音声認識法の検討
- 音素の特徴点に着目した不特定話者音声認識法
- 単音節認識を用いた大語彙辞書検索システムの検討
- 個人差の小さい音素類似度ベクトルを用いた不特定話者用音声認識法
- 音声認識とメタデータを利用した映像検索システムの開発
- 音声認識とメタデータを利用した映像検索システムの開発
- 音声認識とメタデータを利用した映像検索システムの開発
- 電話音声におけるスペクトル歪み対策法の検討
- オフィス向け音声ダイアルの検討
- 企業における研究開発の事例 : 音声認識の商品化
- 登録型英語用モデル音声法の検討
- 音素を単位とした小型・高速の不特定話者・多数語用音声認識装置
- 帯域パワ-とLPCケプストラム係数の時系列を用いた不特定話者用子音認識法
- 音声認識を用いた映像検索システム - キーワード検索率の改善 -
- 音声認識を用いた映像検索システム - 音声認識と読唇の統合 -
- 映像データの音声チャンネルを利用したフリーキーワード検索システムの開発