音声分析変換合成法STRAIGHTにおける音源情報の精密化について
スポンサーリンク
概要
- 論文の詳細を見る
高品質な音声の分析変換合成方法として提案されたSTRAIGHT(Speech/sound Transformation and Representation using Adaptive Interpolation of weiGHTed spectrogram)における幾つかの品質劣化要因を解析し対策を検討したので報告する。一つは有声/無声判定の処理を不要とし、すべての音源情報を連続量として表したことである。もう一つは、ピッチ周期の間で複数回の励起を有する場合に生ずるスペクトル上の二次的構造を除去したことである。これらの改良により、処理の頑健性が向上し以前の変換音声に認められた品質上の問題が解消された。
- 一般社団法人情報処理学会の論文
- 1998-02-19
著者
関連論文
- 基本波検出に基づく高SNRの音声を対象とした高速なF0推定法(音声,聴覚)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 視聴覚統合を利用した非言語的手段による音色知覚の評価について
- スペクトル距離に基づく声道長正規化のための周波数帯域の選定について (応用音響)
- 視聴覚統合における刺激音の時間-周波数的特徴と視覚刺激の形状特徴の検討 : 人間の知覚特性に基づく音楽の可視化システムに向けて(インタフェース)
- 歌声情報処理の最新動向
- 音声分析・変換・合成方法STRAIGHTの音声符号化への適用について
- 基本波検出に基づく高SNRの音声を対象とした高速なF0推定法
- 再合成音声の品質に対する音声スペクトル包絡推定法の影響について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 分析時刻に依存しない周期信号のパワースペクトル推定法を用いた音声分析(ディジタル信号処理)
- TANDEM-STRAIGHTおよび時変モーフィングのための研究用インタフェースの開発について(聴覚・音声・言語とその障害,一般)
- 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの時系列への拡張について(音響信号処理)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 4L-5 STRAIGHTに基づく柔軟な音声合成技術の開発(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- リアルタイムSTRAIGHTの改良とSTRAIGHTライブラリの実装(聴覚・音声・言語とその障害,一般)
- AS-5-1 時間平均に基づく周期信号のパワースペクトル推定法(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- モーフィングに基づく歌唱デザインインタフェースの提案と初期的検討(音楽情報,インタラクションの理解とデザイン)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 母音/子音区間検出を備えた適応形ビームフォーマを用いた母音/子音平均スペクトルに基づく雑音下音声認識
- 適応型ビームフォーマを用いた母音/子音平均スペクトルに基づく音声強調
- 音声のテクスチャマッピングに基づく変換関数を利用した音声モーフィングの自動化について : 音声テクスチャマッピングの一応用例
- 音声の平均スペクトルを用いた帯域分割型CSP法に基づく話者位置推定法に関する検討
- 帯域分割型CSP法に基づく話者位置推定法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 零周波数フィルタ信号に基づく基本周波数抽出法のTANDEM-STRAIGHTへの応用について(音響分析一般(1))
- 圧縮型ガンマチャープ聴覚フィルタによるノッチ雑音データと圧縮特性データへの同時適合
- 音声中の複数の繰返し構造の表現とその基本周波数および非周期性抽出への応用について
- 声道長の正規化に基づく簡易モーフィング音声の品質改良について(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- E-023 ウェブ上の言語知識を利用した音声認識用単語辞書の更新手法(自然言語・音声・音楽,一般論文)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- LG-006 音楽聴取に関する一検討 : グループと頂点の推定(G. 音声・音楽)
- EA2010-35 擬似音声信号を用いた評価による音源構造抽出法の最適化について
- EA2010-36 スペクトル距離に基づく声道長正規化のための周波数帯域の選定について
- 母音情報に基づく話者変換システムの提案 : 音声テクスチャマッピングの一実装例(聴覚・音声・言語とその障害,一般)
- 音声テクスチャマッピング : 多様な発話変換・合成をめざして((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について(スペシャルセッション・歌情報処理1)
- 単語重要度を用いた N-gram 補完手法が与える音声認識性能の調査
- 単語重要度を用いたN-gram補完手法が与える音声認識性能の調査
- 歌声を見て触る: TANDEM-STRAIGHTと時変モーフィングが提供する基盤
- 歌声情報処理の最新動向
- 音声モーフィングの背景と可能性
- 音声分析合成技術の動向 (小特集 音声合成に関する研究の動向)
- 高品質分析合成のための有声音の非周期成分の表現と推定について(聴覚・音声・言語とその障害,一般)
- 表情と感情音声の知覚(感情音声・感情認知I, 感情音声)
- 感性情報に曖昧さがある場合の音声の心理的評価とその物理的特性(聴覚,音声,言語とその障害)
- 3L-5 音声入力Webシステムによる音声認識アプリケーションの構築技術(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音声入力・認識機能を有するWebシステムw3voiceの開発と運用
- E-072 音声入力機能を有する対話型Webアプリケーションの公開試験(E分野:自然言語・音声・音楽)
- 聴覚系における寸法・形状情報抽出の計算理論と脳内部位の検討(機械学習によるバイオデータマインニング,一般)
- E-038 大人・子ども発話の自動識別に基づく安心Webシステムの検討(自然言語・音声・音楽,一般論文)
- 窓関数による分析時刻の影響を受けにくい周期信号のパワースペクトル推定法(研究速報)
- LE-004 単母音による歌唱音声スペクトルの統計的分析に基づく音色制御法の提案と評価(自然言語・音声・音楽)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- STRAIGHTを用いた簡易モーフィングによる印象変化の評価について(セッション2)
- ポップス系歌唱音声のSTRAIGHTによる分析とスペクトル変動の統計的性質について(合成,生成,韻律,一般)
- TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討(ポスターセッション,第10回音声言語シンポジウム)
- 複数旋律音楽に対する演奏表情付けモデルの構築(演奏認識/合成,便利で身近な音楽情報処理)
- 聴覚ボコーダによる混合音声からの音声分離
- STRAIGHTを用いた聴覚メリンイメージからの信号再合成
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- E-041 音声モーフィングのための母音スペクトル間区分線形写像関数自動設計手法(E分野:自然言語・音声・音楽)
- 時間方向および周波数方向の周期性の影響を除去した周期信号のパワースペクトルの表現について : STRAIGHTスペクトル推定の無調整化に向けて(聴覚・音声/一般)
- STRAIGHTスペクトルに基づく音源信号の抽出と非周期成分の評価について(一般)
- 周期信号における時間的変動の影響を受けない位相関連情報の表現について(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 聴覚における情報表現に基づく音声信号の分解 : 周期性からの逸脱をどう扱うか(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 自然性の高い感情音声合成に向けた感情音声データベース構築の検討
- 演奏者にとっての「実感」 : 心の通い合う演奏を求めて(実感させる…人間・音楽・演奏)
- 歌声を見て触る : TANDEM-STRAIGHT と時変モーフィングが提供する基盤
- 歌唱音声制御に伴うスペクトル変動の主成分分析と合成への応用について(聴覚・音声及び一般)
- J-006 ちょっとした一言の音声認識による子ども利用者判別法の検討(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)
- E-012 音声ウェブシステムを用いて収集した実環境子供発話に関する調査(E分野:自然言語・音声・音楽,一般論文)
- 5U-6 ウェブ収集発話を対象とした若年者判別の検討(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 安心ウェブの実現に向けた大人・子ども発話のネット収集実験
- 周波数から瞬時周波数への写像の不動点を用いた音源情報の抽出について
- STRAIGHTの声道情報の量子化についての検討
- 4kHz帯域のSTRAIGHTの品質評価と情報圧縮について
- 音声分析・変換・合成方法STRAIGHT-TEMPOにおける相補的な時間窓の利用について
- 一般逆行列を用いた母音情報に基づく声質変換法について(合成,生成,韻律,一般)
- 音声分析合成技術の動向(音声合成に関する研究の動向)
- 高品質音声分析変換合成システムSTRAIGHTを用いたスキャット生成研究の提案(音楽情報科学)
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- STRAIGHTを用いたCHATRの韻律制御
- 聴覚メリンイメージからの信号再合成
- スケール変形した有声/無声単語の寸法弁別と音韻認識に関する検討(聴覚・音響信号処理/一般)
- STRAIGHTによるリアルタイム歌唱モーフィングシステムの実装(セッション5)
- STRAIGHTによるリアルタイム歌唱モーフィングシステムの実装(セッション5)
- STRAIGHTによる歌声モーフィングの初期的検討
- 調波成分の瞬時周波数を用いた基本周波数推定方法(音声情報処理 : 現状と将来技術論文特集)
- 調波成分の瞬時周波数を用いたピッチ推定方法の検討
- 音色の印象に関わる非パワースペクトル的要因
- 合成音源に対する群遅延制御と基本周波数変換音声の品質
- 音声分析合成系における音源の非周期成分付加方式の比較検討
- 音声の非周期成分の時間特性の抽出と合成について