調波成分の瞬時周波数を用いた基本周波数推定方法(音声情報処理 : 現状と将来技術論文特集)
スポンサーリンク
概要
- 論文の詳細を見る
河原らにより開発されたSTRAIGHTは, VOCODER型分析合成方式であるにもかかわらず, 原音に迫る高い自然性をもった分析合成音を得ることが可能である.しかし, 耐雑音性が低く, 雑音環境下では合成音声の品質が大きく劣化するという弱点があった.それは, STRAIGHTが処理の各段階に基本周期にした処理を積極的に利用していて, 雑音により推定された基本周波数が誤差を含んだ場合, その影響を大きく受けることが原因と考えられる.そこで本論文では, その欠点を克服するために耐雑音性の高い基本周波数推定方法を提案する.このため, 従来のTEMPO法で用いられてきた基本波成分だけではなく, その調波成分も利用し, Cohenの帯域幅方程式を用いて統合する新しい方法を提案する.また, 提案手法の性能の評価のために, 音声データとEGGデータを同時収録したデータベースを作成した.これを用いて提案法及びTEMPO法などの従来法と推定精度の比較をした結果, 提案法は他の従来法に比べて無雑音では同等以上で, 雑音付加時の推定精度は大幅に改善されることがわかった.
- 2000-11-25
著者
-
入野 俊夫
和歌山大学
-
鹿野 清宏
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
河原 英紀
和歌山大学システム工学部デザイン情報学科
-
陸 金林
奈良先端科学技術大学院大学情報科学研究科
-
河原 英紀
和歌山大学
-
中村 哲
奈良先端科学技術大学院大学情報科学研究科
-
鹿野 清宏
奈良先端科学技術大学院大学
-
入野 俊夫
ATR人間情報通信研究所
-
阿竹 義徳
奈良先端科学技術大学院大学情報科学研究科
-
阿竹 義徳
奈良先端大・情報科学研究科
-
中村 哲
奈良先端科学技術大学院大学
関連論文
- 音の持続時間が音源の大きさ知覚に及ぼす影響 : 母音刺激を用いた検討(日本基礎心理学会第28回大会,大会発表要旨)
- 視聴覚統合を利用した非言語的手段による音色知覚の評価について
- スペクトル距離に基づく声道長正規化のための周波数帯域の選定について (応用音響)
- 視聴覚統合における刺激音の時間-周波数的特徴と視覚刺激の形状特徴の検討 : 人間の知覚特性に基づく音楽の可視化システムに向けて(インタフェース)
- 再合成音声の品質に対する音声スペクトル包絡推定法の影響について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- ユーザ感情理解に向けた実環境音声情報案内システムの収集発話分析(言語解析, 対話)
- 分析時刻に依存しない周期信号のパワースペクトル推定法を用いた音声分析(ディジタル信号処理)
- TANDEM-STRAIGHTおよび時変モーフィングのための研究用インタフェースの開発について(聴覚・音声・言語とその障害,一般)
- 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの時系列への拡張について(音響信号処理)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)