不特定話者単語音声認識に対する複合パラメータの効果
スポンサーリンク
概要
- 論文の詳細を見る
We have been developing the speech visualization system as a speech training aid for the hearing impaired. This research has been carried out to build up a recognition system by which it is possible to represent a phoneme sequence on a display screen together with the visualized speech. This kind of system requires to recognize 20-50 isolated words which are spoken by anyone. Moreover, it is desirable that the vocabulary (20-50 words) of the dictionary can freely and easily be constructed or changed. Although the system which has phoneme standard patterns independently of the word dictionary is reasonable to achieve the aim, generally it will not always show a high recognition rate to a large vocabulary. In order to realize the high performance system which satisfies the above requirement, new speech parameters which are mutually complementary for the recognition have been adopted. A local distance between an input frame and each of 32 phoneme categories has been defined as a weighted sum of distances of the parameters because their dimensions are not the same. The weights have been decided to maximize phoneme recognition rates and tested for the word recognition. As a result, the addition of parameters was very effective and the recognition rates by the proposed parameters were much higher than by usually used one. When 50 words uttered by 30 males from two different databases were tested, the recognition rates were 97.2% and 98.3% in Bayes-decision-rule based distance.
- 社団法人日本音響学会の論文
著者
-
渡邊 亮
熊本大学
-
池田 直光
熊本高等専門学校
-
池田 直光
八代工業高等専門学校
-
ドゥトノ ティトン
Graduate School of Science and Technology, Kumamoto University
-
池田 直光
Yatsushiro National College of Technology
-
渡邉 亮
Graduate School of Science and Technology, Kumamoto University
-
Dutono T
Kumamoto Univ. Kumamoto Jpn
-
ドゥトノ ティトン
Graduate School Of Science And Technology Kumamoto University
関連論文
- 音声応用システムのためのリアルタイム音声特徴推定エンジンの構築(合成,生成,韻律,一般)
- 画像化音声を利用する音声分析・表示ツール(Speech-ART)の開発
- 熊本高等専門学校におけるコミュニケーション能力育成の試み
- 25pYK-8 Metal(dmit)_2塩に基づく高導電性LB膜の電気的性質(グラファイト, LB膜,領域7(分子性固体・有機導体))
- 25pYK-7 Metal(dmit)_2塩に基づく高導電性LB膜の赤外分光解析(グラファイト, LB膜,領域7(分子性固体・有機導体))
- 言語情報を伝達する画像化音声の読取りに関する評価(ヒューマンインフォメーション)
- ハイブリッド型人工内耳用スピーチプロセッサと評価システムの開発(ヒューマンコミュニケーショングループ (HCG) シンポジウム)
- ハイブリッド型人工内耳用スピーチプロセッサと評価システムの開発
- 母音同定に必要な第1, 第2ホルマントピークレベル比と可聴領域の関係(聴覚・音声・言語とその障害, 一般)
- 母音同定に必要な第1, 第2ホルマントピークレベル比と可聴領域の関係
- K-066 ハイブリッド型人工内耳シミュレータにおける刺激マッピング機能とその評価(K.ヒューマンコミュニケーション&インタラクション)
- 複合パラメータを用いた単語音声認識に対する声道長比正規化の効果(音声,聴覚)
- 感音性難聴者の音声聴取能力を推定するオージオメータの提案
- 母音情報伝達のための振動触覚呈示方式について
- 発話速度による調音結合の影響を考慮した話者適応化法
- 単語全体の尤度を考慮した単語辞書からの予備選択に関する検討
- I-5 言語訓練器による聴覚障害児の聴きとりと発語の改善
- 九州地区高専における情報基礎教育の現状と今後の課題
- 複合パラメータの音素距離行列に基づく候補単語の絞り込みに関する検討
- 複合パラメータの話者適応化による音素認識の検討
- 話者適応化とパラメータ複合化による音素認識
- 話者適応化とパラメータ複合化による音素認識
- 語中母音の認識における話者正規化と適応化の効果
- 音声の複合特徴を評価するための単語音声認識実験
- 不特定話者単語音声認識に対する複合パラメータの効果
- 複合パラメータによる音素認識のための距離の定義に関する検討
- 単語群の構成が自由な不特定話者単語音声認識について
- LPCスペクトルのローカルピークを用いた母音認識
- Metal(dmit)_2に基づく高導電性ラングミュア・ブロジェット膜 : 超伝導の可能性(II)(分子薄膜デバイス・一般)
- 八代高専教育用電子計算機システムの更新報告
- 自動車車内騒音下単母音認識におけるA特性付加の効果
- FFTスペクトルのローカルピークを用いた母音認識
- パーソナルコンピュータ利用音響データ収録システム
- 感音性難聴者の音声聴取能力と可聴領域内ホルマントピーク分布の関連
- 音声信号の分析・計測・表示ツール, Speech ART2000の開発
- 難聴者の可聴野内ホルマント情報と語音聴力の関係
- 聴覚障害者の音声聴取能力とホルマントピーク分布の関連
- ホルマント分析による補聴処理のDSPシステムに関する検討
- 単共振分解型補聴方式における振幅圧縮特性の制御
- 合成フィルタによるディジタル補聴器のための振幅圧縮処理
- 視聴覚併用受聴補助システムの構成とその動作
- 音声画像を利用した補聴器による音声聴取の学習
- 高導電性ラングミュア・ブロジェット膜の構造と物性
- 健聴者の模擬難聴状態における可聴野内ホルマントピーク分布と音声聴取能力との関係
- 高品質音声を伝達する単共振分解型補聴器
- 6-1 音声画像を用いた難聴者のための聴き取り訓練システム
- 聴覚障害者の聴き取り改善に対する文字と音声画像の併用効果の比較
- 音声画像で聴覚的手がかりを強化する聴能訓練とその効果
- 訓練用音声・画像を記録したCD-ROMによる聴能訓練システム
- 自己学習型の聴能訓練システムの検討
- 単共振分解型補聴器による電話音声の聴き取り改善効果
- ピーク位置正規化空間での補間処理に基づくスペクトルモーフィング手法
- ピーク位置正規化スペクトルモーフィングによる動的特徴・話者特徴の操作とその評価
- 話速の異なる単語による声道長比推定の安定性
- ホルマント軌跡を用いた声道長比推定の信頼性
- ホルマント軌跡に基づく声道長比の推定
- 声質変換補聴音声における部分非線形周波数軸伸縮の効果
- 超微小電流注入マイクロディスクレーザ
- 外部調整機能を考慮したDSP補聴装置の試作
- 声質変換加工に基づく補聴処理方式の検討
- 触覚呈示のための音声スペクトル正規化とその母音ベクトル表現
- 4)聴覚障害者のための音声画像化通信(視聴覚技術研究会)
- 聴覚障害者のための音声画像化通信
- スプライン補間周波数特性を有する合成FIRフィルタの設計
- ケプストラム領域での選択的同時処理に基づく複合補聴処理の検討
- 内挿と全域通過フィルタリングに基づいたサンプリング波形の微小遅延制御法
- スペクトルピークの連続性を考慮したスペクトル補間方式とその補聴音声合成への応用
- 声質変換型補聴音声評価システムの構築とその応用
- 合成フィルタによる補聴器圧縮処理におけるスペクトル推定可変化の効果
- 声質変換補聴音声のためのピッチ制御方式に関する検討
- 声質変換補聴音声の自然性に関する評価
- 合成圧縮フイルタを用いたディジタル補聴処理
- ディジタル補聴器のための合成フィルタ圧縮処理とその評価
- 実時間抽出ピッチを用いた韻律情報の電気触覚呈示
- 単共振分解型補聴器の子音部圧縮特性とその評価
- 24-4 点字解読装置における再構成行画像からの点字コード変換処理について
- 7)任意走査型点字解読装置のためのファイバ画像入力・解読処理について([放送方式研究会映像表現研究会画像処理・コンピュータビジョン研究会画像通信システム研究会画像応用研究会]合同)
- 任意走査型点字解読装置のためのファイバー画像入力・解読処理について : 高精細画像と一般 : 放送方式 : 映像表現 : 画像処理・コンピュータビジョン : 画像通信システム : 画像応用
- 任意走査型点字解読装置のためのファイバー画像入力・解読処理について
- 聴覚代行としての視, 触覚による韻律情報伝達の一評価法について
- 電話音声の画像化を目的としたパラメータ抽出・推定法
- 聴覚障害者のための音声画像化通信
- 聴覚障害者へ伝達されるべき視・聴覚の母音情報
- 連続音声の色彩・形状表現による視覚的単語認知の可能性
- 聴覚障害者のための音声映像化 (可視化技術 : 音を見る・音で見る)
- CADによる汎用信号処理プリント基板の開発
- 電話音声ピッチ周波数抽出システムの試作
- 視覚表示による音声情報の伝達方式 (<小特集>障害者のための感覚補助代行)
- 逆フィルタ制御ホルマント推定における零交差情報の有効性
- 逆フィルタ制御ホルマント推定における零交差情報の有効性
- 母音ホルマント分布に基づく男女間平均声道長比の推定 (音声)
- 母音ホルマント分布に基づく男女間平均声道長比の推定 (応用音響)
- 母音ホルマント分布に基づく男女間平均声道長比の推定 (信号処理)
- 母音ホルマント分布に基づく男女間平均声道長比の推定(一般,音声・音響信号処理,音声及び一般)
- 母音ホルマント分布に基づく男女間平均声道長比の推定(一般,音声・音響信号処理,音声及び一般)
- 母音ホルマント分布に基づく男女間平均声道長比の推定(一般,音声・音響信号処理,音声及び一般)
- 熊本高専生物化学システム工学科におけるICT 実験科目の実践