逆フィルタとモーメント計算によるホルマント周波数抽出と合成音による評価
スポンサーリンク
概要
- 論文の詳細を見る
A new method of formant frequency extraction utilizing characteristic features of the vowel-type spectra is proposed and realized in the form of FORTRAN program. An experimental evaluation of the method is carried out using synthetic speech sounds which simulate various troublesome conditions encountered in formant frequency extraction of natural speech. Inverse filtering in the spectral domain is made so as to leave a simple resonance spectrum of one formant behind from an input spectrum, for schematic example, leaving H^+_2 in Fig. 4(b) behind from P in Fig. 3(b). The formant frequency is then calculated as the first-order moment. A repetition of these two processes shown in Fig. 7 gives fairly accurate formant frequencies. Extractions on five Japanese vowels by five male adults and the non-nasal voiced portions of continuous speech sounds by two male announcers are carried out. Some results of them are shown in Table 4 and Fig. 8. Here discussed are some factors that may give rise to much trouble in the formant frequency extraction. The factors based on source characteristic are the source harmonic structure, zeros of the source spectral envelope, and the gross shape differences of the source spectral envelopes. The factors based on transfer characteristic are rapid formant transitions and their contiguities. In this paper four excitation waveforms and six source fundamental frequencies (100-200 Hz) are used in the synthesis combined with the formant frequency pattern of Fig. 9. Three of the excitation waveforms are triangular as shown in Fig. 1, of which K=0. 5, 0. 7 and 1. 0 and the remaining one is impulse-type. The error distribution of the formant frequencies extracted from these synthetic sounds are shown in Fig. 11. The results of the extraction are examined in relation to the factors described above with the following conclusions reached: (1)Under many troublesome conditions the proposed method provides fairly good accuracy and extraction errors do not exceed half the source fundamental frequency in most cases. (2)The extraction program is relatively simple. The average extraction time is about 0. 23 sec. for each 10ms short-time spectrum by the general-purpose computer NEAC 2200/500(add. , 5. 2μsec. ). It is remarkably fast as compared with usual methods. (3)The results of experiment with synthetic sounds generated under various excitation conditions and natural sounds uttered by many speakers suggest that this method is applicable to various speech sounds reliably.
- 社団法人日本音響学会の論文
- 1970-05-10
著者
関連論文
- 第91回米国音響学会及びIEEEの音響・音声・信号処理に関する1976年国際会議
- 対数パラースペクトルの自己相関関数(ACLOS)による基本周波数の抽出 -抽出精度の検討-
- 日本の音声研究 : 来し方, 行く末 (音声研究)
- 音声と話者の相関関係について
- 振幅情報から生成したピッチ周波数を利用するLPCボコ-ダ(技術談話室)
- SPAC(自己相関関数を利用した音声処理方式)の雑音低減の効果
- 自己相関関数を利用した音声処理方式(SPAC)の機能と基本特性
- 声道壁のインピーダンスの検討
- 各研究分野15年の歩みと将来への展望 : 音声研究 (<小特集>創立40周年記念特集)
- 高騒音下の音声の性質と雑音レベルの低減
- 音声研究の周辺 : 音声特集号(音声情報伝達における障害とその対策)の編集にあたって
- ヘリウム音声のききとり上の性質
- 声帯波形を考慮した"合成による分析"法
- 逆フィルタとモーメント計算によるホルマント周波数抽出と合成音による評価
- 音声波形からの声帯音源波形の観測
- 3個のホルマント周波数による声道の形の簡単な計算
- モーメント計算によるホルマント周波数の抽出
- 音声のピッチ抽出に関するシンポジウム : ピッチ抽出装置の試作
- 線形予測分析に基づくホルマント周波数抽出の雑音耐性の改善
- 平方根及び4乗根パワースペクトルの自己相関に基づくピッチ抽出
- ARプレフィルタを用いたIIR型適応等化器とIIR型ウィーナーフィルタ
- 雑音補正による音声のLPC分析の改善
- 対数スペクトルの自己相関関数を用いた搬送波抑圧SSBの離調周波数の推定
- 高速スタートアップ等化のためのButler-Cantoni法の適応化
- ACLOSを利用した搬送波抑圧SSB信号のF_0/2以上の離調周波数の推定
- 改良SIFT法によるPITCH抽出
- 自己相関波形を利用した狭帯域音声から広帯域音声の復元
- AM放送受信音声の帯域拡張
- 予測残差信号を利用した改良ケプストラム法による基本周波数の抽出
- 雑音環境下における基本周波数の抽出
- 品質劣化音声のためのLPC分析の一改良法
- 雑音環境下におけるACLOSを利用した搬送波抑圧SSB信号の離調周波数の推定
- 雑音補正LPC分析方式を用いた音声のホルマント周波数の推定
- 改良ケプストラム法による基本周波数の抽出
- 対数スペクトルの自己相関関数を利用したピッチ抽出法
- ACLOSを利用した搬送波抑制SSB信号の離調周波数の推定-耐雑音特性についての評価-
- 自己相関関数の線形予測分析によるホルマント周波数の推定
- 対数パワースペクトルの自己相関関数(ACLOS)を利用した搬送波抑圧SSB信号の離調周波数の推定
- 多ビット送信シーケンスを用いたPPM光CDMAシステムの特性解析
- ディジタル音声の性質を利用した超音波領域への帯域拡張法
- ディジタル音声の広帯域化再生法によるCDの再生 -音場による評価-
- プライム符号の相互相関特性の解析と光CDMAシステムにおけるビット誤り率
- EWO符号とRTTを用いた畳み込み符号化光CDMA通信システム
- アナログ音声通信路に重畳して伝送するデータ通信法
- プライム符号の相互相関特性の解析と光CDMAシステムにおけるビット誤り率
- プライム符号の相互相関特性の解析と光CDMAシステムにおけるビット誤り率
- マルチビットシーケンスを用いた光PPM同期CDMAシステムの特性解析
- マルチビットシーケンスを用いた光PPM同期CDMAシステムの特性解析
- マルチビットシーケンスを用いた光PPM同期CDMAシステムの特性解析
- 咽喉マイクによる音声を用いた重み付き明瞭度(WAS)とMOSの相関関係
- 重み付き明瞭度による合成音の評価
- 調音位置と調音様式による異聴の分析 -音素間の距離を利用した重み付き明瞭度(WAS)の有効性-
- 自己相関関数を用いた電話帯域音声の広帯域化の検討
- 音素間の距離を利用した重み付き明瞭度による音節明瞭度の再評価
- 全極型プレフィルタを用いた IIR 型適応等化器
- 搬送波抑圧SSBで受信音声を利用した送信周波数の推定
- 調波構造を利用した精密な基本周波数の推定
- 差分関数を利用した音声処理方式(SPAD)のSN比改善効果
- 差分関数を利用した音声処理法式 - SPAD -
- 音声通信セミナー (第8回ICA報告)
- 音声部門 (第8回ICA報告)
- Speech symposium-Szeged- (第7回国際音響学会議報告)
- 耐雑音性を考慮したケプストラム法の改良
- 調波構造からARスペクトル推定を利用した基本周波数抽出法
- 対数パワースペクトル上での線形予測を用いた狭帯域音声から広帯域音声の生成
- 平方根および四乗根パワースペクトルの自己相関関数による基本周波数の抽出
- LPC分析のための雑音除去の検討 -相関領域でのスペクトルサブトラクション-
- 前向き後向き差分関数とフィルタバンクを利用した音声信号の雑音低減
- 低SN比音声のための自己相関法によるLPC分析の改良
- ARMAモデルによる鼻音からの話者認識パラメータの有効性
- 高調波の振幅抽出による音声の再合成 -フィルタバンクを利用した音声強調-
- 対数スペクトルの自己相関関数を利用したピッチ抽出法
- データ拡張を利用する2次元スペクトル推定法とその改良
- ブラインド等化のためのプレフィルタリング
- 前向き後向き差分関数とフィルタバンクを利用した音声強調方式
- 日本語早口言葉の構造と性質
- 前向き後向き差分関数による単一正弦波信号の強調
- A-138 安定なARモデルに基づくデータ予測を利用した2次元スペクトル推定(A-4. ディジタル信号処理,一般講演)
- 自己相関関数SPAC)を用いた狭帯域音声から広帯域音声の復元
- A-122 ARMAプレフィルタを用いた適応等化(A-4. ディジタル信号処理,一般講演)
- 高圧条件下の母音のききとり : 合成音の聴取による検討
- 高圧環境下の音声通信
- デルタ変調を利用した分析合成系のピッチ伝送方式
- 雑音分散の推定とデータ予測を利用する1次元および2次元スペクトル推定