歌唱音声の類似度評価を目的とした声質に関する音声特徴量の提案(ポスターセッション,第13回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,歌唱音声における類似度を測る音声特徴量の検討を行なう.今回は,歌唱者の声質とビブラート部分のスペクトル変動に着目し,それぞれに関する音声特徴量を用いて類似度の評価を行なう.比較に用いた歌声データは,歌い方や声質が特徴的だと思われる目標の歌手を物真似した歌声と,物真似していない歌声である.そして,CD音源から目標の歌手の歌声のみを抽出した歌声を用いて比較を行なった.比較に用いた音声特徴量は,歌唱者の声質に関してはフォルマントの分布である.また,ビブラート部分のスペクトル変動に関しては,ケプストラム歪,スペクトル重心の変動である.フォルマントの分布の変動の比較により,いくつかの音素の分布がCD音源の分布に近づいており,歌唱者の声質が目標歌手に近づいていることが分かった.また,ビブラート部分のスペクトル変動については,ケプストラム歪の比較より,物真似ありの方がCD音源に近づいていることが分かった.さらに,スペクトル重心の変動の比較では,物真似ありの方が物真似なしより大きな変動をしておりCD音源の変動に近いことが明らかとなった.以上より,物真似ありの音声が,声質及びビブラート部分のスペクトル変動ともに目標歌手に近づいていることを示せた.
- 2011-12-12
著者
-
板倉 文忠
名城大学大学院理工学研究科
-
板倉 文忠
名城大学理工学部
-
森勢 将雅
立命館大学 情報理工学部
-
坂野 秀樹
名城大学理工学部
-
鈴木 千文
名城大学大学院理工学研究科
-
森勢 将雅
立命館大学
-
森勢 将雅
立命館大学情報理工学部:jst Crest Crestmuse
-
板倉 文忠
名古屋大学 情報メディア教育センター
-
鈴木 千文
名城大学理工学研究科
-
板倉 文忠
名城大学理工学研究科
-
坂野 秀樹
名城大学理工学研究科
関連論文
- 基本波検出に基づく高SNRの音声を対象とした高速なF0推定法(音声,聴覚)
- 視聴覚統合を利用した非言語的手段による音色知覚の評価について
- 高品質分析合成のための有声音の非周期成分の表現と推定について
- 音源構造抽出法の初期推定値のバイアス除去と高速化について
- 歌手によるビブラート特徴量の違いの分析 (音声)
- 声質制御への応用を目的とした声道断面積関数の分析(音声合成・分析)
- 声質制御への応用を目的とした声道断面積関数の分析(音声合成・分析)
- 視覚・聴覚を併用した複合現実感システムのための頭部伝達関数の個人化
- EA2010-37 歌唱合成システムの実現を目的とした高品質音声分析合成法の提案
- EA2010-35 擬似音声信号を用いた評価による音源構造抽出法の最適化について
- 動的特徴に着目した音声分析合成音の明瞭性向上手法の提案 (音声)
- 歌唱特徴付与システム「ロックボーカルレゾネータ」
- 実時間歌唱力補正に基づく新たなカラオケエンタテインメントの創出
- 歌声を見て触る: TANDEM-STRAIGHTと時変モーフィングが提供する基盤
- 奄美大島民謡節回し付加システム「グインレゾネータ」
- 歌唱力転写システム制作に向けての検討
- 近接音源位置推定のための2D-CSP法の評価(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 近接音源位置推定のための2D-CSP法の評価(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 近接音源位置推定のための2D-CSP法の評価(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 端点検出を行わない連続音声認識
- 高品質分析合成のための有声音の非周期成分の表現と推定について(聴覚・音声・言語とその障害,一般)
- 残響指標RSR-Dnに基づく残響環境下音声認識の予測性能評価(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 残響指標RSR-D_nに基づく残響環境下音声認識の予測性能評価(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 残響指標RSR-D_nに基づく残響環境下音声認識の予測性能評価(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- ロンバード特徴量変換に基づく音声認識性能の改善(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- LK-004 運転行動信号に含まれる個人性に関する検討(K. ヒューマンコミュニケーション&インタラクション)
- 擬音語HMMに基づく音場ディクテーションの検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- 擬音語HMMに基づく音場ディクテーションの検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- ロンバード特徴量変換に基づく音声認識性能の改善(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 擬音語HMMに基づく音場ディクテーションの検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
- ロンバード特徴量変換に基づく音声認識性能の改善(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 指向性マイクロホンを用いた波面合成法における波面合成精度
- 波面合成におけるチャネル数の主観的影響 : 音源が正面付近にある場合
- 移動音源がある音場の空間符号化 : 音源抽出による伝送量の削減
- 音場再現におけるマルチチャネル信号の空間符号化
- 移動音源に対するマルチチャンネル音場空間符号化の検討
- 歌唱特徴付与システム「ロックボーカルレゾネータ」
- 音声中の複数の繰返し構造の表現とその基本周波数および非周期性抽出への応用について
- 視聴覚統合を利用した非言語的手段による音色知覚の評価について
- ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討(対話インタフェース)(第5回音声言語シンポジウム)
- ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討(第5回音声言語シンポジウム : 対話インタフェース)
- ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討(第5回音声言語シンポジウム : 対話インタフェース)
- 汎用音声認識エンジンJulius/JulianのPDAへの移植と性能評価
- 声道断面積関数を用いたGMMに基づく歌唱音声の声質変換(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 声道断面積関数を用いたGMMに基づく歌唱音声の声質変換 (音声)
- テンポの変化による影響を考慮した歌唱音声合成に関する検討(スペシャルセッション・歌情報処理2)
- テンポの変化による影響を考慮した歌唱音声合成に関する検討(スペシャルセッション・歌情報処理2)
- LF-001 事典コーパスを用いた単語階層関係の統計的解析(F. 人工知能)
- 動的特徴に着目した音声分析合成音の明瞭性向上手法の提案(音声一般,合成,生成,韻律,音声一般)
- 歌手によるビブラート特徴量の違いの分析(音楽・歌声,合成,生成,韻律,音声一般)
- バイモーダル車内音声認識評価用データベースの構築
- 二段雑音スペクトルの推定と回帰による車内音声認識
- 二段雑音スペクトルの推定と回帰による車内音声認識
- 二段雑音スペクトルの推定と回帰による車内音声認識
- 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 統計的手法による音声の分析・合成 : ML法からPARCORを経てLSPへ(フェロー賞受賞特別招待講演)
- 統計的手法による音声の分析・合成 : ML法からPARCORを経てLSPへ
- 統計的手法による音声の分析・合成 : ML法からPARCORを経てLSPへ(フェロー賞受賞特別招待講演)
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(一般セッション(4) : 福祉・医療のためのパターン認識・メディア理解)
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(福祉・医療のためのパターン認識・メディア理解)
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(福祉・医療のためのパターン認識・メディア理解)
- スペクトルサブトラクションとピッチ同期KLTの複数の雑音抑圧手法を組合せたAurora2データベースに対する音声認識性能の改善
- スペクトルサブトラクションとピッチ同期KLTの複数の雑音抑圧手法を組合せたAurora2データベースに対する音声認識性能の改善
- 複数モデルを選択的に用いる音声対話システムにおけるドメイン切り替え尺度の検討
- 音声対話システムにおけるドメイン識別の検討
- 対数スペクトルの重回帰に基づく分散マイクロホン出力の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 対数スペクトルの重回帰に基づく分散マイクロホン出力の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 大規模車内音声データベースにおける認識性能変動要因調査(耐雑音)(第5回音声言語シンポジウム)
- 大規模車内音声データベースにおける認識性能変動要因調査(第5回音声言語シンポジウム : 耐雑音)
- 大規模車内音声データベースにおける認識性能変動要因調査(第5回音声言語シンポジウム : 耐雑音)
- スパーク音源を用いた頭部伝達関数の測定
- ボコーダと音声情報圧縮(音叉)
- 装着型マイクロホンを用いた受音系の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 装着型マイクロホンを用いた受音系の検討(音響と音声処理,音声強調,ロバスト音声認識)
- CIAIR実走行車内音声データベース(ポスターセッション)(第5回音声言語シンポジウム)
- 聴覚マスキングを用いた頭外音像定位の評価法の検討
- CIAIR実走行車内音声データベース(第5回音声言語シンポジウム : ポスターセッション)
- CIAIR実走行車内音声データベース(第5回音声言語シンポジウム : ポスターセッション)
- A-17-1 自動車運転動作からの個人性抽出に関する検討
- 音声対話システムにおける言語モデルのオンライン適応についての検討
- タッピングを利用した音声認識の検討
- 音声認識における音響モデル言語モデルの切り替え方法に関する検討
- 頭部近傍におけるHRTFの測定
- スペクトルサブトラクションと櫛形フィルタを組み合わせた音声強調
- 複数の装着型マイクロホンを用いた受音系の構築に関する検討
- 波面合成におけるチャネル数の主観的影響 : 音源が正面付近にある場合
- 移動音源がある音場の空間符号化 : 音源抽出による伝送量の削減
- 楽曲分類におけるラウド感を表す音響特徴量の評価(音声・言語・音響教育,一般)
- 音場再現におけるマルチチャネル信号の空間符号化
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討(ポスターセッション,第13回音声言語シンポジウム)
- 歌唱音声の類似度評価を目的とした声質に関する音声特徴量の提案(ポスターセッション,第13回音声言語シンポジウム)
- 歌唱音声の類似度評価を目的とした声質に関する音声特徴量の提案(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討