静的・動的パラメータを用いた英語連続音声の音素セグメンテーションシステム
スポンサーリンク
概要
- 論文の詳細を見る
英語連続音声認識の前処理として実用になるような音素セグメンテーションシステムを構築し有効性を確かめた.英語連続音声には発声があいまいなシュワー(schwa)と呼ばれる弱声の母音が多数存在するために,これまで安定して音素境界を検出するのが困難とされ,認識の前処理として実用になるようなセグメンテーションシステムの具体化の提案はほとんど見られなかった.提案法では,まず音声信号から対数スペクトルの不偏推定法によってメルケプストラムを抽出する.これは微細周波数構造に影響されにくい安定した方法であることが知られている.次に,このメルケプストラムから,疑似微分フィルタを利用してシュワー性の音素の境界を検出することができるような特性をもつ動的なセグメンテーションパラメータを求め,静的なパラメータを併用して階層的な形で音素単位のセグメンテーションを行う.提案システムは話者に依存した複雑な境界検出規則を使用せずに,声質や発声法の異なる話者に共通な音響音韻知識のみを利用して,多様な音素環境を含む英語連続音声を音素単位に時間区分化する.英語を母国語とする男女1名の話者によって発声された350秒の音素バランスした英語連続音声による提案システムの評価実験では,総音素数3,024個に対して音素境界の検出率97.1%,境界脱落率2.9%,境界付加率24.2%という結果を得た.
- 社団法人電子情報通信学会の論文
- 1995-03-25
著者
-
今井 聖
東京工業大学精密工学研究所
-
今井 聖
千葉工業大学工学部
-
相澤 桂
桐蔭横浜大学工学部
-
古市 千枝子
桐蔭横浜大学工学部
-
古市 千枝子
桐蔭学園横浜大学工学部制御システム工学科
-
今井 聖
東京工業大学
-
相澤 桂
桐蔭学園横浜大学工学部制御システム工学科
関連論文
- 適応メルケプストラム分析を利用した音声符号化とその評価
- ML基準パラメータ系列生成に基づく半連続HMMによる雑音音声認識
- 音声認識におけるルールベース法による話者独立音素セグメンテーション
- 音素セグメンテーションに基づく統計的音素セグメントモデルによる音声認識
- 音声認識における話者独立音素セグメンテーション
- IFスペクトログラム : 音声信号の時間周波数表現の一手法
- IFスペクトログラム : 音声信号の時間周波数表現の一手法
- 瞬時周波数に基づく雑音環境下でのピッチ推定
- RBFネットワークのハイブリッド学習アルゴリズム
- 改良DFT-MUSIC法を用いた低SNR環境における瞬時周波数の推定
- 音声信号の瞬時周波数に基づく振幅スペクトル表現
- 低SNR環境下における瞬時周波数の推定
- 瞬時周波数に基づく雑音環境下でのピッチ推定
- 音声信号の非線形時間軸伸縮と瞬時周波数に基づく倍音推定
- 雑音劣化音声の一般化ケプストラムモデル化における事前情報の利用
- 非直線周波数目盛における音声の一般化対数スペクトル包絡とそのモデル
- マルチセグメントベクトル量子化のコードブックを用いる認識率の高い話者独立単語音声認識システム
- 体系的な意味カテゴリーで記述された係り受け関係を利用する日本語文音声認識
- 演算式歯形測定器
- 並列音素ラベリング (PPL) 方式による話者独立単語音声認識システム
- コンテキスト独立な音素認識により得られた信頼度付き音素ラティスを用いる単語音声認識
- 統計的音素セグメントモデルによる日本語音声認識に関する研究(学位論文の紹介)
- 複数のHMMセットを選択的に用いる話者独立音声認識
- 音韻環境依存型音素セグメントHMMによる音声認識
- 静的・動的パラメータを用いた英語連続音声の音素セグメンテーションシステム
- 音韻環境依存の音素レファレンスパターンを選択的に用いた英語連続音声中の音素認識
- [フェロー記念講演]メルケプストラム音声信号処理(音響と音声処理,音声強調,ロバスト音声認識)
- [フェロー記念講演]メルケプストラム音声信号処理(音響と音声処理,音声強調,ロバスト音声認識)
- メル一般化ケプストラム分析に基づくCELP音声符号化
- メル一般化ケプストラム係数に基づく音声のスペクトル表現とその諸特性
- 動的特徴を用いたHMMからの音声パラメータ生成アルゴリズム
- HMMを用いた音声合成における話者適応による声質変換
- 中国語連続音声認識における音素的セグメンテーション
- 動的特徴を用いたHMMに基づく音声合成
- MA予測を用いたメル一般化ケプストラムの量子化
- ML基準パラメータ系列生成に基づくHMMの雑音環境への適応
- 意味解析と最適探索を利用した中国語文音声認識
- HMMを用いた音声合成における音素モデルの検討
- 大語彙中国語連続音声認識の言語処理システム
- メルケプストラムをパラメータとするHMMに基づく音声合成
- HMMからの音声パラメータ生成アルゴリズム
- HMMを用いた音声合成法に関する検討
- メル一般化ケプストラムパラメータの音素認識における評価
- 特定話者任意語い連続音声の音素認識
- 多様な音韻環境における音素的単位のセグメンテ-ション (新しい音声処理技術特集)
- 連続音声の音素的単位へのセグメンテ-ション
- 中国語連続音声の4声認識
- 対数スペクトルの不偏推定
- 音声の規則合成のためのメルケプストラムCV音節デ-タファイルの自動作成
- 高品質音声合成のためのインパルス列等価音源
- CV音節のメルケプストラムパラメ-タの接続に基づく音声の規則合成
- 音声合成のためのメル対数スペクトル近似(MLSA)フィルタ
- 対数振幅特性近似フィルタを利用する楽器音の合成(技術談話室)
- メル一般化ケプストラム分析による音声のスペクトル推定
- メル一般化ケプストラムに基づくCELP符号化系とその評価
- メル一般化ケプストラム分析に基づくCELP符号化
- メル一般化ケプストラムによる音声のスペクトル表現とその諸特性
- メル一般化ケプストラムに基づく音声符号化の検討
- 低ビットレート音声符号化のためのメルケプストラム係数のベクトル量子化
- メルケプストラムをパラメータとするCELP符号化系
- 中国語連続音声の声調認識
- 中国語連続音声の四声認識