セグメント特徴量を用いた実用向けの不特定話者音声認識
スポンサーリンク
概要
- 論文の詳細を見る
高精度かつ耐ノイズ性能に優れた不特定話者大語彙(い)音声認識を少ない計算量で実現する実用向けの方法について報告する.本方法の第1の特徴は,複数のフレームの分析パラメータから形成されるセグメント特徴量を入力とした音響モデルにより高精度な認識を実現していることである.第2の特徴は音響モデル内の各状態の出力確率に対応するゆう度値の計算を,入力パラメータベクトルを変数とする1次式で行っていることである.この1次式は等共分散仮定から導き出される.この1次式化により,認識性能を低下させることなくセグメント特徴量化に伴う計算量及びメモリ量の増大を抑えている.第3の特徴はゆう度計算に事後確率化の考え方を反映させることにより,ノイズ区間から正解候補を検出する安定したワードスポッティング機能を実現していることである.このワードスポッティング機能によりノイズに対して頑健な音声認識が実現できる.走行車両の車室内騒音を付加した認識実験により本方式の有効性を示す.
- 社団法人電子情報通信学会の論文
- 2002-03-01
著者
-
石田 明
松下電器・avコア技術開発センター
-
木村 達也
松下通信
-
二矢田 勝行
電子情報通信学会:九州工業大学工学部電気工学科
-
木村 達也
松下通信工業株式会社
-
石田 明
松下通信工業株式会社
-
二矢田 勝行
松下通信工業株式会社
関連論文
- 音声による文例検索方法の検討
- 未知語の処理方法の検討
- 単語共起モデルの評価
- 単語タイプライタを用いた文音声認識法における高速化の検討
- 単語共起と単語Bigramによる制約を用いた文認識法の検討
- 共分散共有型HMMにおける計算量削減方法の検討
- セグメント特徴量を用いた実用向けの不特定話者音声認識
- MLLR話者適応における学習の高速化
- カード型不特定話者音声認識装置
- 語彙変更が容易な不特定話者用小型音声認識ボード
- 音素の特徴点に着目した大語彙不特定話者音声認識法
- 1チップDSPで作動する実用的な不特定話者音声認識法
- 音素の特徴点に着目した不特定話者音声認識法の検討
- 音素の特徴点に着目した不特定話者音声認識法
- 単音節認識を用いた大語彙辞書検索システムの検討
- 個人差の小さい音素類似度ベクトルを用いた不特定話者用音声認識法
- 話者適応組込み音声認識システムの使用環境変動に対する頑健性の検討
- 高齢者音声の解析と認識評価
- オフィス向け音声ダイアルの検討
- 企業における研究開発の事例 : 音声認識の商品化
- 登録型英語用モデル音声法の検討
- 音素を単位とした小型・高速の不特定話者・多数語用音声認識装置
- 帯域パワ-とLPCケプストラム係数の時系列を用いた不特定話者用子音認識法