非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討(ポスターセッション,第13回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,歌声信号と伴奏信号を重ね合わせた楽曲信号から非負値行列分解を用いて歌声信号を抽出する方法について検討する.非負値行列分解は,入力スペクトログラムに対し,スペクトログラム上に現れる類似したスペクトルパターンを一つの基底ベクトルとして表現することで,複数の基底ベクトルと,それぞれの時間変化情報に分離することができる.しかし,歌声に現れるビブラートなどスペクトルが時間的に変動する信号に対しては有限個の基底で表現することが困難なため,歌声の抽出に適していない.この問題を解決するために,楽曲信号中の歌声信号の基本周波数を基準となる音高に一致させることで基本周波数によるスペクトルの変動を除去し,この信号に対して非負値行列分解を行う手法を提案する.抽出された歌声信号と伴奏信号をS劔比により評価した結果,従来法に比べ提案法は合成信号の劣化が表れ,S/N比は低くなる傾向があったが,一部の楽曲信号で有効性が確認された.
- 2011-12-12
著者
-
板倉 文忠
名城大学大学院理工学研究科
-
板倉 文忠
名城大学理工学部
-
坂野 秀樹
名城大学理工学部
-
板倉 文忠
名古屋大学 情報メディア教育センター
-
安井 優太
名城大学大学院理工学研究科
-
板倉 文忠
名城大学理工学研究科
-
坂野 秀樹
名城大学理工学研究科
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- TANDEM-STRAIGHTおよび時変モーフィングのための研究用インタフェースの開発について(聴覚・音声・言語とその障害,一般)
- 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの時系列への拡張について(音響信号処理)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- TANDEM-STRAIGHTによるスペクトル包絡の近似精度の改善について : 基本周波数により定まるNyquist周波数以上の空間周波数成分の復元について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 4L-5 STRAIGHTに基づく柔軟な音声合成技術の開発(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- リアルタイムSTRAIGHTの改良とSTRAIGHTライブラリの実装(聴覚・音声・言語とその障害,一般)
- リアルタイムSTRAIGHTの改良とSTRAIGHTライブラリの実装
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- 音声のテクスチャマッピングに基づく変換関数を利用した音声モーフィングの自動化について : 音声テクスチャマッピングの一応用例
- 零周波数フィルタ信号に基づく基本周波数抽出法のTANDEM-STRAIGHTへの応用について(音響分析一般(1))
- 歌手によるビブラート特徴量の違いの分析 (音声)
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- 声質制御への応用を目的とした声道断面積関数の分析(音声合成・分析)
- 声質制御への応用を目的とした声道断面積関数の分析(音声合成・分析)
- 母音情報に基づく話者変換システムの提案 : 音声テクスチャマッピングの一実装例(聴覚・音声・言語とその障害,一般)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について(音声合成・声質変換,第10回音声言語シンポジウム)
- 動的特徴に着目した音声分析合成音の明瞭性向上手法の提案 (音声)
- 端点検出を行わない連続音声認識
- 高品質分析合成のための有声音の非周期成分の表現と推定について(聴覚・音声・言語とその障害,一般)
- LK-004 運転行動信号に含まれる個人性に関する検討(K. ヒューマンコミュニケーション&インタラクション)
- 指向性マイクロホンを用いた波面合成法における波面合成精度
- 波面合成におけるチャネル数の主観的影響 : 音源が正面付近にある場合
- 移動音源がある音場の空間符号化 : 音源抽出による伝送量の削減
- 音場再現におけるマルチチャネル信号の空間符号化
- 移動音源に対するマルチチャンネル音場空間符号化の検討
- 歌唱音声の音量変化に伴うスペクトル変形の分析について
- 連続音声認識コンソーシアム2002年度版ソフトウエアの概要
- 連続音声認識コンソーシアム2001年度版ソフトウエアの概要
- ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討(対話インタフェース)(第5回音声言語シンポジウム)
- ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討(第5回音声言語シンポジウム : 対話インタフェース)
- ユーザ評価と達成度との相関に基づく音声対話システムの品質評価の予備的検討(第5回音声言語シンポジウム : 対話インタフェース)
- 汎用音声認識エンジンJulius/JulianのPDAへの移植と性能評価
- TANDEM-STRAIGHTに基づく基本周波数の抽出と評価について(音声合成・韻律,第9回音声言語シンポジウム)
- E-041 音声モーフィングのための母音スペクトル間区分線形写像関数自動設計手法(E分野:自然言語・音声・音楽)
- 時間方向および周波数方向の周期性の影響を除去した周期信号のパワースペクトルの表現について : STRAIGHTスペクトル推定の無調整化に向けて(聴覚・音声/一般)
- STRAIGHTスペクトルに基づく音源信号の抽出と非周期成分の評価について(一般)
- 声道断面積関数を用いたGMMに基づく歌唱音声の声質変換(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 声道断面積関数を用いたGMMに基づく歌唱音声の声質変換 (音声)
- テンポの変化による影響を考慮した歌唱音声合成に関する検討(スペシャルセッション・歌情報処理2)
- テンポの変化による影響を考慮した歌唱音声合成に関する検討(スペシャルセッション・歌情報処理2)
- LF-001 事典コーパスを用いた単語階層関係の統計的解析(F. 人工知能)
- リアルタイムSTRAIGHTの実装と特徴量削減の影響に関する検討((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- 動的特徴に着目した音声分析合成音の明瞭性向上手法の提案(音声一般,合成,生成,韻律,音声一般)
- 歌手によるビブラート特徴量の違いの分析(音楽・歌声,合成,生成,韻律,音声一般)
- バイモーダル車内音声認識評価用データベースの構築
- 二段雑音スペクトルの推定と回帰による車内音声認識
- 二段雑音スペクトルの推定と回帰による車内音声認識
- 二段雑音スペクトルの推定と回帰による車内音声認識
- 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 統計的手法による音声の分析・合成 : ML法からPARCORを経てLSPへ(フェロー賞受賞特別招待講演)
- 統計的手法による音声の分析・合成 : ML法からPARCORを経てLSPへ
- 統計的手法による音声の分析・合成 : ML法からPARCORを経てLSPへ(フェロー賞受賞特別招待講演)
- 歌唱音声制御に伴うスペクトル変動の主成分分析と合成への応用について(聴覚・音声及び一般)
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(一般セッション(4) : 福祉・医療のためのパターン認識・メディア理解)
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(福祉・医療のためのパターン認識・メディア理解)
- 映像付き雑音環境下音声認識評価用共通データベースAURORA-2J-AV/AURORA-3J-AVの構築(福祉・医療のためのパターン認識・メディア理解)
- スペクトルサブトラクションとピッチ同期KLTの複数の雑音抑圧手法を組合せたAurora2データベースに対する音声認識性能の改善
- スペクトルサブトラクションとピッチ同期KLTの複数の雑音抑圧手法を組合せたAurora2データベースに対する音声認識性能の改善
- 複数モデルを選択的に用いる音声対話システムにおけるドメイン切り替え尺度の検討
- 音声対話システムにおけるドメイン識別の検討
- 対数スペクトルの重回帰に基づく分散マイクロホン出力の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 対数スペクトルの重回帰に基づく分散マイクロホン出力の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 大規模車内音声データベースにおける認識性能変動要因調査(耐雑音)(第5回音声言語シンポジウム)
- 大規模車内音声データベースにおける認識性能変動要因調査(第5回音声言語シンポジウム : 耐雑音)
- 大規模車内音声データベースにおける認識性能変動要因調査(第5回音声言語シンポジウム : 耐雑音)
- スパーク音源を用いた頭部伝達関数の測定
- ボコーダと音声情報圧縮(音叉)
- 装着型マイクロホンを用いた受音系の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 装着型マイクロホンを用いた受音系の検討(音響と音声処理,音声強調,ロバスト音声認識)
- CIAIR実走行車内音声データベース(ポスターセッション)(第5回音声言語シンポジウム)
- 聴覚マスキングを用いた頭外音像定位の評価法の検討
- CIAIR実走行車内音声データベース(第5回音声言語シンポジウム : ポスターセッション)
- CIAIR実走行車内音声データベース(第5回音声言語シンポジウム : ポスターセッション)
- A-17-1 自動車運転動作からの個人性抽出に関する検討
- 音声対話システムにおける言語モデルのオンライン適応についての検討
- タッピングを利用した音声認識の検討
- 音声認識における音響モデル言語モデルの切り替え方法に関する検討
- 時間領域平滑化群遅延を用いた短時間位相の効率的表現方法
- 時間領域平滑化群遅延による位相制御を用いた声質制御方式(音声情報処理 : 現状と将来技術論文特集)
- 頭部近傍におけるHRTFの測定
- スペクトルサブトラクションと櫛形フィルタを組み合わせた音声強調
- 複数の装着型マイクロホンを用いた受音系の構築に関する検討
- 実走行中の車内データを用いた車内騒音の合成に関する検討
- 群遅延に基づく位相の聴覚的距離尺度
- 群遅延に基づく位相の聴覚的距離尺度
- 瞬時周波数に基づいたイベント同期型正弦波モデルについて
- 波面合成におけるチャネル数の主観的影響 : 音源が正面付近にある場合
- 移動音源がある音場の空間符号化 : 音源抽出による伝送量の削減
- 楽曲分類におけるラウド感を表す音響特徴量の評価(音声・言語・音響教育,一般)
- 音場再現におけるマルチチャネル信号の空間符号化
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討(ポスターセッション,第13回音声言語シンポジウム)
- 歌唱音声の類似度評価を目的とした声質に関する音声特徴量の提案(ポスターセッション,第13回音声言語シンポジウム)
- 歌唱音声の類似度評価を目的とした声質に関する音声特徴量の提案(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討
- 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討