音声モーフィングによる聴感的印象制御に有効な特徴量の検証(オーガナイズドセッション「多様な音声の認識・合成へ向けて」,音声,言語,対話,一般)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,音声についての言語的な明瞭性ではなく,聴感的印象(本研究では聴いた印象が「はきはき」「もごもご」していることを対象とする)の制御に向けた取り組みについて述べる.本研究の目的は,所謂音声明瞭度・了解度のような言語情報の書き取りで生じる差ではなく,会話が可能な程度に明瞭であるものの,聴取者に与える印象が異なる場合を対象とした差の評価・制御にある.これまでの検討により,発話中の口の動きが聴感的印象に関連することが確認されたので,本稿では,聴感的印象を改善するための声質変換を実現するための検討を行う.ここでは,口の動きに対応する制御パラメタを明らかにするため,音声モーフィングによりいくつかのパラメタを段階的に変化させ,主観評価により聴感的印象の評価を行うこととした.はきはき語す声ともごもご話す声を対象に,声道断面積関数(Vocal tract area function:VTAF),残差スペクトル,F0,非周期性指標それぞれについて独立してモーフィングを行うことで聴感的印象に対応する特徴量を調査する.実験の結果,残差スペクトルとVATFが聴感的印象に強く影響することが確認され,F0と非周期性指標には影響されないことが明らかとなった.本結果は,聴感的印象はスペクトル包絡の特徴のみで制御可能であることを示唆するものである.
- 一般社団法人電子情報通信学会の論文
- 2014-01-16
著者
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- TANDEM-STRAIGHTおよび時変モーフィングのための研究用インタフェースの開発について(聴覚・音声・言語とその障害,一般)
- 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの時系列への拡張について(音響信号処理)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 4L-5 STRAIGHTに基づく柔軟な音声合成技術の開発(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- リアルタイムSTRAIGHTの改良とSTRAIGHTライブラリの実装(聴覚・音声・言語とその障害,一般)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- 3Q-7 大画面ディスプレイにおける鉛直方向の腹話術効果に関する考察(音声の分析・合成,学生セッション,人工知能と認知科学)
- 鉛直方向の腹話術効果に及ぼす音響再生系の影響
- 音声のテクスチャマッピングに基づく変換関数を利用した音声モーフィングの自動化について : 音声テクスチャマッピングの一応用例
- 聴覚臨場感の基礎特性 : コンテンツ臨場感とシステム臨場感
- 音の再生方式及び話者映像が競合話者存在下での単語了解度に及ぼす影響(研究速報)
- 両耳間レベル差の個人化が音像定位に及ぼす効果(聴覚・信号処理/一般)
- 音の再生方式と高能率符号化が競合話者存在下での単語了解度に及ぼす影響(電気音響, 音響一般)
- バイノーラル補正における音場に関する拘束条件の解除法の提案(聴覚・信号処理/一般)
- 単語了解度試験におけるモーラ同定に対する親密度の影響
- G-004 演奏者情報が音楽聴取時の感性に及ぼす影響(G分野:音声・音楽)
- 零周波数フィルタ信号に基づく基本周波数抽出法のTANDEM-STRAIGHTへの応用について(音響分析一般(1))
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- 母音情報に基づく話者変換システムの提案 : 音声テクスチャマッピングの一実装例(聴覚・音声・言語とその障害,一般)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- 高品質分析合成のための有声音の非周期成分の表現と推定について(聴覚・音声・言語とその障害,一般)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- E-041 音声モーフィングのための母音スペクトル間区分線形写像関数自動設計手法(E分野:自然言語・音声・音楽)
- 時間方向および周波数方向の周期性の影響を除去した周期信号のパワースペクトルの表現について : STRAIGHTスペクトル推定の無調整化に向けて(聴覚・音声/一般)
- STRAIGHTスペクトルに基づく音源信号の抽出と非周期成分の評価について(一般)
- 声道断面積関数を用いたGMMに基づく歌唱音声の声質変換(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- リアルタイムSTRAIGHTの実装と特徴量削減の影響に関する検討((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- 動的特徴に着目した音声分析合成音の明瞭性向上手法の提案(音声一般,合成,生成,韻律,音声一般)
- BS-8-4 視聴覚情報の有無がコンテンツ臨場感評価に及ぼす影響(BS-8.Beyond QoS/QoE(2):聴覚的コミュニケーションにおけるユーザ体験としての臨場感/超臨場感,シンポジウムセッション)
- 音響による複数到来車両の検出手法の構築と評価
- 複数車両に対応したマイクロホンアレーによる接近車両検出システムの構築
- 覚醒ネコ第一次聴覚野における持続性細胞の音圧レベル感受性を模擬する機能モデル
- 音響による複数到来車両の検出手法の構築と評価(ITS情報処理,一般)
- 楽曲分類におけるラウド感を表す音響特徴量の評価(音声・言語・音響教育,一般)
- バイノーラル補正における音場に関する拘束条件の解除
- バイノーラル再生音の音像知覚に高能率符号化が及ぼす影響(バーチャルリアリティと心理学)
- 動画像処理を用いた音像フローの算出(音響信号処理,聴覚,一般)
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討(ポスターセッション,第13回音声言語シンポジウム)
- 歌唱音声の類似度評価を目的とした声質に関する音声特徴量の提案(ポスターセッション,第13回音声言語シンポジウム)
- 歌唱音声の類似度評価を目的とした声質に関する音声特徴量の提案(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討
- TANDEM-STRAIGHT によるスペクトル包絡の近似精度の改善について基本周波数により定まる Nyquist 周波数以上の空間周波数成分の復元について
- オーディオ再生方式がAVコンテンツの臨場感に及ぼす影響とそのモデル化(音響信号処理,聴覚,一般)
- 歌唱音声における基本周波数とパワーの変動量を反映するビブラート特徴量の提案とその評価方法について(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- スクリーム唱法における基本周波数とスペクトル変動の相関の調査(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 両耳情報に基づく音の包み込まれ感の推定モデルに関する一考察(音響信号処理,聴覚,一般)
- 音声モーフィングによる聴感的印象制御に有効な特徴量の検証(オーガナイズドセッション「多様な音声の認識・合成へ向けて」,音声,言語,対話,一般)