可変長辞書を用いた単音節認識装置
スポンサーリンク
概要
- 論文の詳細を見る
This paper covers the experiment on the Japanese syllable recognition system with the variable duration dictionary by using a 16 bits microcomputer(MN1613). We reported a syllable recognition experiment in the previous paper(Transactions of the Committee on Speech Research, Acoust. Soc. Jpn. , 13-144, S82-18, 1982)by using super minicomputer VAX-11/780. Correct recognition rate 94% was obtained and the validity of the variable duration dictionary algorithm was confirmed. Some improvement in the algorithm has been done to adopt the algorithm to the microcomputer. Ninety-five percents correct recognition rate is obtained on the microcomputer system. Segmentation technique is newly employed and the duration, from -51. 2 ms to +51. 2 ms for vowels and voiceless stop, -102. 4 ms to +51. 2 ms for voiced consonants, -51. 2 ms to 102. 4 ms for semivowels are chosen in the variable duration dictionary. Moreover we propose a technique for segmentation considering the bandpower difference between male and female speakers and also propose a new algorithm to discriminate /si/ to /ci/ and /su/ to /tsu/. Ninety-five percents correct recognition rate for 10 speakers has been obtained with the 68 Japanese mono-syllables. Each syllable is spoken 10 or 20 times for both male and female speakers in this experiment.
- 社団法人日本音響学会の論文
著者
-
谷口 裕一
Central Research Laboratories Matsushita Electric Industrial Co. Ltd.
-
前原 文雄
Central Research Laboratories, Matsushita Electric Industrial Co., Ltd.
-
相良 良二
Kyushu Matsushita Electric Co., Ltd.
-
楠原 久代
Central Research Laboratories, Matsushita Electric Industrial Co., Ltd.
-
坪香 英一
Central Research Laboratories, Matsushita Electric Industrial Co., Ltd.
-
前原 文雄
松下電器産業株式会社pavc社
-
坪香 英一
松下電器産業株式会社中央研究所
-
坪香 英一
Central Research Laboratories Matsushita Electric Industrial Co. Ltd.
-
相良 良二
Kyushu Matsushita Electric Co. Ltd.
-
楠原 久代
Central Research Laboratories Matsushita Electric Industrial Co. Ltd.
関連論文
- 顔画像認識、シーン検出機能を組み込んだMPEG-7メタデータフォーマット(MPEG-7-MDR)によるファイル管理方式とそのデジタルスチルカメラ、デジタルムービーへの応用(映像情報機器及び一般)
- 12-2 静止画・音声ファイル装置
- 可変長辞書を用いた単音節認識装置
- 顔画像認識、シーン検出機能を組み込んだMPEG-7メタデータフォーマット(MPEG-7-MDR)によるファイル管理方式とそのデジタルスチルカメラ、デジタルムービーへの応用 (マルチメディアストレージ コンシユーマエレクトロニクス)
- 20-9 磁気ディスクによる音声信号の記録再生方式
- 特徴ベクトル間の非類似度を帰属度ベクトル間の非類似度とする音声認識
- Kullback-Leibler Divergenceを距離尺度とする音声認識
- ファジーベクトル量子化に基づくHMMの数理的考察とその改良
- 相乗型FVQ/HMM