並列音素ラベリング (PPL) 方式による話者独立単語音声認識システム
スポンサーリンク
概要
- 論文の詳細を見る
音素レベルに自動的に時間区分化された音声のセグメントのラベリングを複数の異なる音素レファレンスパターンセットを用いて並列に行い,その結果得られた複数の音素ラティスと辞書項目との記号例マッチングを音素ラティスごとに行うことにより単語の認識を行う形の話者独立単語音声認識システムを提案し,実験によりその有効性を確かめた.発声様式や声質の大きく異なる話者には,別々に音素レファレンスパターンセットを用意し,それらを用いて並列に音素ラベリングを行えば,任意の話者の音声に対していずれかの音素レファレンスパターンセットが適切に対応することになる.単語の認識の段階で結果的に音素列の認識が行われるようになっており,音素ラベリングの段階で複数の音素レファレンスパターンセットの中から入力話者に適合したレファレンスパターンセットを特定するための付加的な処理は不要である.男性3名と女性3名が発声した音声データをもとにして各話者ごとに作成した6セットの音素レファレンスパターンセットを利用して並列音素ラベリング方式による単語音声認識システムを構成し,レファレンスパターン作成のための話者とは別の6名の男性と6名の女性の合計12名の話者が発声した音韻バランス単語212語に対する話者オープンの音声認識実験を行ったところ,全話者に対する平均認識率が88.2%,話者別の最低認識率が83.0%となり,男女すべての話者による六つの音素レファレンスパターンセットを混合して得た話者独立型のレファレンスパターンセットを用いたシステムと比較して,本提案のシステムは平均認識率で1.9%,話者別の最低認識率で5.2%高く,話者独立型の単語音声認識システムとして良い結果が得られた.
- 社団法人電子情報通信学会の論文
- 1994-02-25
著者
-
今井 聖
東京工業大学精密工学研究所
-
土居 仁士
特許庁
-
古市 千枝子
桐蔭横浜大学工学部
-
谷口 一郎
東京工業大学精密工学研究所
-
古市 千枝子
桐蔭学園横浜大学工学部制御システム工学科
-
今井 聖
東京工業大学
-
川崎 智之
東京工業大学精密工学研究所
関連論文
- 適応メルケプストラム分析を利用した音声符号化とその評価
- 音声認識におけるルールベース法による話者独立音素セグメンテーション
- 音素セグメンテーションに基づく統計的音素セグメントモデルによる音声認識
- 音声認識における話者独立音素セグメンテーション
- IFスペクトログラム : 音声信号の時間周波数表現の一手法
- IFスペクトログラム : 音声信号の時間周波数表現の一手法
- 瞬時周波数に基づく雑音環境下でのピッチ推定
- RBFネットワークのハイブリッド学習アルゴリズム
- 改良DFT-MUSIC法を用いた低SNR環境における瞬時周波数の推定
- 低SNR環境下における瞬時周波数の推定
- 瞬時周波数に基づく雑音環境下でのピッチ推定
- 雑音劣化音声の一般化ケプストラムモデル化における事前情報の利用
- 非直線周波数目盛における音声の一般化対数スペクトル包絡とそのモデル
- マルチセグメントベクトル量子化のコードブックを用いる認識率の高い話者独立単語音声認識システム
- 体系的な意味カテゴリーで記述された係り受け関係を利用する日本語文音声認識
- 演算式歯形測定器
- 並列音素ラベリング (PPL) 方式による話者独立単語音声認識システム
- コンテキスト独立な音素認識により得られた信頼度付き音素ラティスを用いる単語音声認識
- 統計的音素セグメントモデルによる日本語音声認識に関する研究(学位論文の紹介)
- 複数のHMMセットを選択的に用いる話者独立音声認識
- 音韻環境依存型音素セグメントHMMによる音声認識
- 静的・動的パラメータを用いた英語連続音声の音素セグメンテーションシステム
- 音韻環境依存の音素レファレンスパターンを選択的に用いた英語連続音声中の音素認識
- メル一般化ケプストラム係数に基づく音声のスペクトル表現とその諸特性
- 動的特徴を用いたHMMからの音声パラメータ生成アルゴリズム
- 中国語連続音声認識における音素的セグメンテーション
- 動的特徴を用いたHMMに基づく音声合成
- 意味解析と最適探索を利用した中国語文音声認識
- 大語彙中国語連続音声認識の言語処理システム
- メルケプストラムをパラメータとするHMMに基づく音声合成
- HMMからの音声パラメータ生成アルゴリズム
- 特定話者任意語い連続音声の音素認識
- 多様な音韻環境における音素的単位のセグメンテ-ション (新しい音声処理技術特集)
- 連続音声の音素的単位へのセグメンテ-ション
- 中国語連続音声の4声認識
- 対数スペクトルの不偏推定
- 音声の規則合成のためのメルケプストラムCV音節デ-タファイルの自動作成
- 高品質音声合成のためのインパルス列等価音源
- CV音節のメルケプストラムパラメ-タの接続に基づく音声の規則合成
- 音声合成のためのメル対数スペクトル近似(MLSA)フィルタ
- 対数振幅特性近似フィルタを利用する楽器音の合成(技術談話室)
- メル一般化ケプストラム分析による音声のスペクトル推定
- メル一般化ケプストラム分析に基づくCELP符号化
- メル一般化ケプストラムによる音声のスペクトル表現とその諸特性
- メルケプストラムをパラメータとするCELP符号化系
- 中国語連続音声の声調認識
- 中国語連続音声の四声認識