音声認識の実用化を阻むもの
スポンサーリンク
概要
- 論文の詳細を見る
かつては,高コスト・低性能が音声認識の実用化を阻む大きな要因と考えられていた.現在は,技術の進歩とハードウェアの発達によって,以前に比べて遥かに低コスト・高性能が達成されている.それでもなお,かつて予想されていたほどには音声認識は使われていない.いままで多数の研究者が,音声認識は有用な技術であると信じて研究開発に多大な努力を払ってきたのは幻想なのだろうか.ひたすら研究をして音声認識率を向上すれば応用は自然に開かれてくるものなのだろうか?それとも,何か盲点のようなものがあって,それが問題の本質なのだろうか?この疑問に対して研究者自身が考えていること,および筆者の意見を述べる.
- 社団法人電子情報通信学会の論文
- 1995-09-05
著者
関連論文
- バッチディクテーションのための教師なし話者適応
- バッチディクテーションのための繰り返し教師なし話者適応
- 電話サービスを想定した話者照合
- 自動音声認識の現状と臨床応用の将来性
- 話者適応のための木構造話者クラスタリング
- 学習移動ベクトルの相関関係を用いた音響モデルの話者適応化
- 4階層共有構造の音響モデルによる音声認識
- 雑音適応におけるTaylor展開の2次微分項の導入による効果
- 音声認識機能を含むマルチモーダルインタフェースをもつ住所入力システムの開発と評価
- 離散混合分布型HMMにおける量子化方法の検討
- 単語グラフを用いた大語彙連続音声認識における近似演算法
- 大語彙連続音声確認のためのコンパクトな可変長n-gramモデル
- Jacobian適応法による雑音適応の性能評価
- Jacobi行列を用いた音響モデルの適応アルゴリズム
- 音声認識のための音響モデルの構造
- 単語グラフを用いた大語彙連続音声認識における近似演算手法の検討
- 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識
- Taylor展開による音響モデルの適応
- 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識
- Taylor展開による音響モデルの適応
- 音声認識合成による応用構築の容易な電話対話システム
- Taylor展開に基づく高速な音響モデル適応法
- スペクトルサブトラクションとNOVO合成を用いた雑音下音声認識
- 語彙制約なし音声認識における識別誤り最小化学習の検討
- 音響モデルのタスク適応における学習データに関する検討
- 全音素エルゴディック隠れマルコフ網を用いた教師なし話者適応方式
- 音声認識合成による応用構築の容易な電話音声対話システム
- インターネットと音声・オーディオ処理技術
- Delayed Arc EvaluationによるLRパーザ制御に基づくViterbiサーチ
- 音声認識による住所データ入力時間短縮の効果と不適切発声の認識性能への影響
- マルチモーダルインタフェースを持つ住所入力システムの評価実験
- 音声認識機能を持つ住所入力システム
- 音声入力機能を持つ住所入力システム
- 音声認識機能を持つ住所入力システム
- 音声認識における新しい高速化
- HMM-LR方式音声認識サーバを用いたマルチモーダル入力
- クライアント・サーバ構成のHMM-LR連続音声認識システムとその応用
- 実時間音声認識における高精度探索方式--音素環境依存モデルを用いたHMM-LR音声認識方式の高速化 (インタラクティブな音声インタフェ-スの実現を目指して)
- 自立語と付属語の連鎖統計モデルを用いた音声認識のための候補選択
- 識別誤り最小化を用いた少量データのための効果的なHMM学習法
- 最大事後確率推定と移動ベクトル場平滑化の組合せによる逐次話者・回線適応
- 最大事後確率推定と移動ベクトル場平滑化の組合せによる逐次話者・回線適応
- 前向きヒューリスティック関数を用いたビーム探索によるHMM-LR連続音声認識
- スカラー量子化による4階層共有構造HMMの高速計算
- 前向き尤度を用いたA^*ビーム探索によるHMM-LR音声認識
- 学習移動ベクトル間に相関を持つ音響モデルの共有構造
- 6. 音声認識技術実用への課題 (<解説> 音声言語情報処理の現状と研究課題)
- 音声認識の実用化を阻むもの
- 音声認識によるマルチモーダルインタラクションへの視点
- 4階層共有構造の音素HMM
- 4階層共有構造の音素HMM
- なぜ音声認識は使われないか・どうすれば使われるか?