TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
分析位置に依存しない周期信号のパワースペクトル推定法であるTANDEMと、それに基づくスペクトル包絡の推定法STRAIGHTとを組み合わせた、基本周波数抽出法が提案されている。本資料では、このTANDEM-STRAIGHTに基づく基本周波数抽出法に含まれている設計パラメタの役割と抽出器の性能との関係を調べ、それらの最適化を試みた。取上げた設計パラメタは、周波数軸上での周期性の評価に用いる調波の個数と、それぞれ異なった基本周波数に特化した複数の基本周波数抽出器を統合する際の、それぞれの抽出器の守備範囲を定める重み関数の幅である。まず、それぞれのパラメタがどのように抽出性能に影響するかを説明した後、EGG信号を同時記録した音声データベースを用いて、パラメタの値と抽出器の性能との関係を定量的に評価した。その結果、Gross errorを評価指標とした場合の最適値として、調波の個数は3、重み関数の幅は、特化した基本周波数の1/1.2が採用された。これらの最適値を用いた場合の性能は、これまでのSTRAIGHTの基本周波数抽出器、および広く引用されているYINと比較しても、遜色ないことが確認された。
- 社団法人電子情報通信学会の論文
- 2008-12-02
著者
-
入野 俊夫
和歌山大学
-
河原 英紀
和歌山大学システム工学部デザイン情報学科
-
西村 竜一
和歌山大学システム工学部デザイン情報学科
-
森勢 将雅
立命館大学情報理工学部
-
森勢 将雅
関西学院大学大学院理工学研究科
-
西村 竜一
奈良先端科学技術大学院大学情報科学研究科
-
西村 竜一
和歌山大学
-
板垣 英恵
和歌山大学システム工学部
-
入野 俊夫
Ntt基礎研究所
-
河原 英紀
和歌山大学
関連論文
- 音の持続時間が音源の大きさ知覚に及ぼす影響 : 母音刺激を用いた検討(日本基礎心理学会第28回大会,大会発表要旨)
- 視聴覚統合を利用した非言語的手段による音色知覚の評価について
- スペクトル距離に基づく声道長正規化のための周波数帯域の選定について (応用音響)
- 視聴覚統合における刺激音の時間-周波数的特徴と視覚刺激の形状特徴の検討 : 人間の知覚特性に基づく音楽の可視化システムに向けて(インタフェース)
- 再合成音声の品質に対する音声スペクトル包絡推定法の影響について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- ユーザ感情理解に向けた実環境音声情報案内システムの収集発話分析(言語解析, 対話)
- 分析時刻に依存しない周期信号のパワースペクトル推定法を用いた音声分析(ディジタル信号処理)
- TANDEM-STRAIGHTおよび時変モーフィングのための研究用インタフェースの開発について(聴覚・音声・言語とその障害,一般)
- 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの時系列への拡張について(音響信号処理)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 4L-5 STRAIGHTに基づく柔軟な音声合成技術の開発(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- リアルタイムSTRAIGHTの改良とSTRAIGHTライブラリの実装(聴覚・音声・言語とその障害,一般)
- AS-5-1 時間平均に基づく周期信号のパワースペクトル推定法(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- 音声のテクスチャマッピングに基づく変換関数を利用した音声モーフィングの自動化について : 音声テクスチャマッピングの一応用例
- はじめての聴覚フィルタ(やさしい解説)
- 音声の平均スペクトルを用いた帯域分割型CSP法に基づく話者位置推定法に関する検討
- 帯域分割型CSP法に基づく話者位置推定法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 零周波数フィルタ信号に基づく基本周波数抽出法のTANDEM-STRAIGHTへの応用について(音響分析一般(1))
- 圧縮型ガンマチャープ聴覚フィルタによるノッチ雑音データと圧縮特性データへの同時適合
- 音声中の複数の繰返し構造の表現とその基本周波数および非周期性抽出への応用について
- 声道長の正規化に基づく簡易モーフィング音声の品質改良について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- E-023 ウェブ上の言語知識を利用した音声認識用単語辞書の更新手法(自然言語・音声・音楽,一般論文)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- EA2010-35 擬似音声信号を用いた評価による音源構造抽出法の最適化について
- EA2010-36 スペクトル距離に基づく声道長正規化のための周波数帯域の選定について
- 母音情報に基づく話者変換システムの提案 : 音声テクスチャマッピングの一実装例(聴覚・音声・言語とその障害,一般)
- 音声テクスチャマッピング : 多様な発話変換・合成をめざして((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- 周期信号における時間的変動の影響を受けない位相関連情報の表現について (音声)
- 単語重要度を用いた N-gram 補完手法が与える音声認識性能の調査
- 単語重要度を用いたN-gram補完手法が与える音声認識性能の調査
- 圧縮型ガンマチャープ聴覚フィルタによるノッチ雑音データと圧縮特性データへの同時適合
- 高品質分析合成のための有声音の非周期成分の表現と推定について(聴覚・音声・言語とその障害,一般)
- 3L-5 音声入力Webシステムによる音声認識アプリケーションの構築技術(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音声入力・認識機能を有するWebシステムw3voiceの開発と運用
- E-072 音声入力機能を有する対話型Webアプリケーションの公開試験(E分野:自然言語・音声・音楽)
- 音声のピッチと寸法情報の処理を担う脳領域のfMRIによる検討
- 聴覚系における寸法・形状情報抽出の計算理論と脳内部位の検討(機械学習によるバイオデータマインニング,一般)
- E-038 大人・子ども発話の自動識別に基づく安心Webシステムの検討(自然言語・音声・音楽,一般論文)
- 窓関数による分析時刻の影響を受けにくい周期信号のパワースペクトル推定法(研究速報)
- LE-004 単母音による歌唱音声スペクトルの統計的分析に基づく音色制御法の提案と評価(自然言語・音声・音楽)
- 歌唱音声の音量変化に伴うスペクトル変形の分析について
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- 聴覚ボコーダによる混合音声からの音声分離
- STRAIGHTを用いた聴覚メリンイメージからの信号再合成
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- E-041 音声モーフィングのための母音スペクトル間区分線形写像関数自動設計手法(E分野:自然言語・音声・音楽)
- 時間方向および周波数方向の周期性の影響を除去した周期信号のパワースペクトルの表現について : STRAIGHTスペクトル推定の無調整化に向けて(聴覚・音声/一般)
- STRAIGHTスペクトルに基づく音源信号の抽出と非周期成分の評価について(一般)
- 周期信号における時間的変動の影響を受けない位相関連情報の表現について(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 劣化音声の知覚特性と音声認識器の認識傾向の比較
- 劣化処理した単音節系列音の知覚に関する検討
- リアルタイムSTRAIGHTの実装と特徴量削減の影響に関する検討((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- 聴覚特性を考慮した高品質領域におけるSTRAIGHTパラメタの補間特性に関する検討((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- J-006 ちょっとした一言の音声認識による子ども利用者判別法の検討(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)
- E-012 音声ウェブシステムを用いて収集した実環境子供発話に関する調査(E分野:自然言語・音声・音楽,一般論文)
- 5U-6 ウェブ収集発話を対象とした若年者判別の検討(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 安心ウェブの実現に向けた大人・子ども発話のネット収集実験
- 様々な周波数における圧縮型ガンマチャープのパラメータ推定
- 一般逆行列を用いた母音情報に基づく声質変換法について(合成,生成,韻律,一般)
- 対数時間軸伸縮による人間の頭部伝達関数測定の精度改善について
- 高品質音声分析変換合成システムSTRAIGHTにおける分析窓の検討(合成,生成,韻律,一般)
- スケール変形した有声/無声単語の寸法弁別と音韻認識に関する検討
- 自然発話された単語音声を用いた音源寸法知覚における弁別閾の測定
- 聴覚メリンイメージからの信号再合成
- スケール変形した有声/無声単語の寸法弁別と音韻認識に関する検討(聴覚・音響信号処理/一般)
- 聴覚系における共鳴体の「大きさ」知覚の時間追随性 : 寸法変調音声を用いた検討(日本基礎心理学会第26回大会,大会発表要旨)
- 騒音適応型音楽再生システムのパラメタ設定における聴覚モデルによる評価の応用について
- 調波成分の瞬時周波数を用いた基本周波数推定方法(音声情報処理 : 現状と将来技術論文特集)
- レクチャー講演 聴覚フィルタの測定と定式化について
- 測定用信号として音声を用いたクロススペクトル法によるインパルス応答推定の誤差評価(電気音響,音響一般)
- Detection of temporal modulation of "size" in vowel sequences(ACOUSTICAL LETTER)
- 聴覚ボコーダを用いた基本周期に基づく音声分離(国際ワークショップ:Speech dynamics by Ear, Eye, Mouth and Machine)
- 高品質分析合成のための有声音の非周期成分の表現と推定について
- 母音テンプレートを用いた音声モーフィングのためのスペクトル特徴点設定((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- 帯域分割型CSP法に基づく話者位置推定法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 帯域分割型CSP法に基づく話者位置推定法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- Implementation of realtime STRAIGHT speech manipulation system : Report on its first implementation(Applied Systems)
- 音声研究から音聲研究へ(ちょっとしたエッセイ,コーヒーブレーク)
- スペクトルピークを強調したF0適応型スペクトル包絡抽出法の最適化と評価(音声,聴覚)
- 言葉の明瞭度と楽器等の音色を保持したクロス合成法の検討
- 帯域毎の持続時間に基づく音響イベント検出と位置推定への応用
- 知覚特性を考慮したインパルス応答補償法についての一検討 : 群遅延操作の弁別閾の周波数依存性について
- 暗騒音と高調波ひずみに頑健なインパルス応答測定用信号 : Warped-TSP(電気音響, 音響一般)
- STRAIGHT を用いたビブラート歌唱音声の統計的性質
- 単独母音間の話者寸法弁別に影響を与える時間的要因の検討
- 寸法変調母音系列の同定成績と寸法抽出過程の時間的追随性との関連性(音声・聴覚,一般)
- 聴覚における「形」の恒常性と寸法正規化について(日本基礎心理学会第24回大会,大会発表要旨)
- 時間周波数表現における3種類の不動点と音響的特徴について
- 複数の周期成分を持つ音声のための周期構造抽出法と障害音声分析への応用について(音響信号処理,聴覚,一般)
- 言葉の明瞭度と楽器等の音色を保持したクロス合成法の検討(音響信号処理,聴覚,一般)