カテゴリごとの部分空間を埋め込んだニューラルネットワークによる不特定話者音声認識
スポンサーリンク
概要
- 論文の詳細を見る
This paper describes a speaker independent word recognition algorithm that is based on four layer neural networks with embedded eigenvectors. Eigenvectors from the subspace method (SM) are used as weights for the first hidden layer. A similarity measure given by SM is calculated by cumulative summation of the projection components of an input pattern onto a set of eigenvectors. In contrast to this, our new method evaluates each projection component to achieve better performance than SM. We propose the subspace training (SST) algorithm with SM and the decision controlled back propagation training (DCBPT) algorithm to improve recognition performance and to reduce training times. Training and recognition experiments were performed using a 26 word vocabulary consisting of train station names. The error rate was 1. 3% using SM and was reduced to 0. 7% using the combination of neural networks and SM.
- 社団法人日本音響学会の論文
著者
-
松浦 博
静岡県立大学経営情報学部
-
正井 康之
株式会社東芝研究開発センター
-
正井 康之
AI & Man-machine Interface Technology Department,Information Systems Engineering Laboratory,Toshi
-
松浦 博
AI & Man-machine Interface Technology Department,Information Systems Engineering Laboratory,Toshi
-
新田 恒雄
AI & Man-machine Interface Technology Department,Information Systems Engineering Laboratory,Toshi
関連論文
- 日本語発話の発音誤り検出における留学生と日本人学生との対比 : 音声セグメント技術による「じ」と「ち」の弁別を中心として
- 音声認識による発語機能評価システムを用いた健常歯列者の発語分析
- 3.上顎義歯の口蓋形態の違いが発語機能に及ぼす影響(一般口演,第35回学術大会)
- 3.上顎義歯の口蓋形態の違いが発語機能に及ぼす影響(一般口演II)
- チェアサイドで使用可能な発語評価のための音声認識の開発(産学連携論文)
- 音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション
- 留学生による日本語発話におけるモーラタイミングの音声セグメント技術による評価 (特集 リズムとタイミング)
- 文字正解精度との相関の高い補正パープレキシティの算出法
- 東芝パソコンの音声認識 / 合成ソフトウェア
- パソコン用音声認識ソフトウェアの応用
- 音声認識/合成OCXの開発
- 予備選択とA^*探索による大語彙単語認識
- 単語スポッティングに適した語頭・語尾モデルの検討
- 東芝における最近の音声合成・認識の応用
- SBusカードを用いたWSベース大語彙音声認識システム
- 環境騒音の違いが音声認識に与える影響
- 上顎義歯の大連結子の走行が発語機能に及ぼす影響
- 東芝の音声認識・合成ソフトウエアの紹介
- パソコン用文音声合成ソフトウェアエンジンの開発
- 発話意図理解と回答誘導による異言語間会話支援ツールの試作(マルチモーダルインタフェース,インタラクション技術の原理と応用)
- 音声処理モジュールのプログラミングインタフェースとアプリケーション開発環境
- 音声合成/認識APIと応用ソフト開発環境の動向
- 音声入出力のタッチパネルを用いたマルチモーダル対話システムの試作
- 音声言語インタフェースのための情報処理学会試行標準
- 音声認識読み記号および音声関連ソフトウエアに係わる用語の試行標準案
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- 音声言語情報処理に関する情報処理学会の試行標準策定活動
- 複合音響特徴平面に基づく音声認識のための局所特徴抽出法(音声情報処理 : 現状と将来技術論文特集)
- マルチモーダルUIにおけるモダリティ制御統一のためのモデル化手法 (音声言語情報処理)
- ラピッドプロトタイピングツールMuseのCASEへの適用(マルチモーダルIF (3),「マルチモーダルと音声HI」およびヒューマンインタフェース/音声言語情報処理一般)
- ラピッドプロトタイピングツールMuseのCASEへの適用
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- ラピッドプロトタイピングツールMuseの開発
- オブジェクト指向モデリングおよび設計を用いたラピッドプロトタイピングツールMuseの開発
- ラピッドプロトタイピングツールMuse(1)
- 社会情報システムのためのラピッドプロトタイピングツールMuseの開発
- 社会情報システムのためのラピッドプロトタイピングツールMuseの開発
- マルチモーダルUIとラピッドプロトタイピング
- マルチモーダルUIとラピッドプロトタイピング
- マルチモーダルUIデザイン支援ツールの開発
- マルチーモーダル対話システムのためのUI設計支援ツール
- マルチモーダル対話システムMultiksDial
- マルチモ-ダル対話の社会情報システムへの応用 (ヒュ-マンインタフェ-ス)
- 音声入出力とタッチパネルを用いたマルチモーダル対話システムの評価
- Windows PC用音声認識ソフトウェア
- KL展開と一般化確率降下法によるセグメント量子化の高速化
- 高速版SMQ/HMMによる不特定話者音声認識
- カテゴリごとの部分空間を埋め込んだニューラルネットワークによる不特定話者音声認識
- チェアサイドで補綴治療時の発語機能評価が可能な音声認識装置の開発
- SMQ/HMM方式に基づく不特定話者大語彙単語認識
- 音声認識へのニュ-ラルネット応用 (ニュ-ラルネット利用技術)
- 不特定話者の連続音声認識に対する調音パラメ-タの有効性--母音認識実験による検討
- SMQ/HMM方式に基づく不特定話者大語い単語認識
- 直交化音声セグメント符号帳を用いたHMMに基づく不特定話者単語認識
- K-L変換に基づく話者適応と高速辞書照合を用いた大語い単語音声認識 (新しい音声処理技術特集)
- 留学生による日本語発話におけるモーラタイミングの音声セグメント技術による評価(リズムとタイミング)