LPCによる歌声のピッチ補償
スポンサーリンク
概要
- 論文の詳細を見る
近年、カラオケ等の普及により、我々が歌を歌う機会が非常に増えてきている。ほとんどの場合、我々はあらかじめ録音された伴奏にあわせて歌うわけであるが、その際、(1)歌い手のもつ音域が曲の本来の音域と適切にかみあわない、(2)歌う間にテンポがずれてしまう、(3)本来の曲の音程からずれた状態で歌ってしまう、(4)歌の音域が歌い手のそれより広い、などの問題がしばしば発生する。(1)の問題はカラオケのキーチェンジャーのように伴奏のキーを変更することで容易に解決される。また、(2)の問題点については歌い手のテンポに伴奏があわせる適応型カラオケシステムなどの研究が現在なされている。一方、(3)と(4)の問題については、現在のところ有効な解決法が存在しない。市販製品でピッチ補正を行うと、歌声が変質してしまい、ひどく不自然な音声になってしまう。そのため個人の声質情報を保存したままピッチのみを修正する必要がある。最近、これまでのサンプリングレートの変調によるピッチ補正に対しピッチ情報と個人特性情報を分離した上でピッチ変更、再合成する方法が声質を保存するピッチ変更法として提案されている。たとえば、複素ケプストラム分析合成による方式、スペクトル領域で歪みを修正する方式などがあるが、我々は音声の合成、符号化等で広く用いられている線形予測符号化方式(LPC)を人の歌声に適用してピッチ補償を試みた。ここではその最近の成果について報告する。
- 1996-03-06
著者
関連論文
- A-15-21 積荷をインターフェースとしたクローラ・車輪型搬送ロボットDai-shaの開発(A-15.ヒューマン情報処理,一般セッション)
- 1ZA-1 ディジタルミラーの開発(VRシステム,学生セッション,インタフェース)
- F08(3) 感性インタフェースをデザインする(【F08】ヒューマンインタフェースデザインのフロンティア)
- 主成分の順位を保持する非線形主成分分析(情報論的学習理論論文小特集)
- 最適化のための粗視化ニュートン法
- 声道モデルの機械系による実現とその計算機制御
- 適応型歌声自動伴奏システム
- 歌声のピッチ検出による自動伴奏システム
- 快適生活支援RTシステムの開発
- 6-3 ロボットの感性化 : 人に優しいロボット(6.感性の産業応用,感性情報学)
- 情報機器利用スキル獲得プロセスに関する研究
- 人間と機械の新しい関係 : ワセダのロボットたち
- 情報機器利用スキル獲得プロセスに関する研究(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 早稲田大学先進理工学部応用物理学科 : 橋本研究室
- 3W-1 意味センサネットワークを用いたロボットシステムの制御(ロボットと社会インフラ,学生セッション,ネットワーク)
- 1303 急加速度状況での上半身運動によるロポットのバランス制御の試み(要旨講演,一般セッション:メカニカルシステムとその知能化)
- 6ZD-8 "意味"を伝達するセンサネットワークの提案(アバタ・エージェント・ロボット,学生セッション,インターフェース)
- 2ZC-2 可視光ビームインタフェースを用いた生活空間の提案(インタラクティブデザイン,学生セッション,インターフェース)
- 3W-5 カメラ動きパラメータのクラスタリングによる動視点からの動物体検出(動画像・メディア理解,学生セッション,人工知能と認知科学)
- 2V-7 距離画像とカラー画像のセンサフュージョンに基づくロボットの人間追従(3次元画像処理,学生セッション,人工知能と認知科学)
- ロボットと画像計測・認識
- 連想型自己組織化マップを用いたリズム演奏支援システム(音楽情報,インタラクションの理解とデザイン)
- Passive RFIDを用いた自律移動ロボットのナビゲーション(留学生による日本語技術論文)
- A-20-14 RFIDを用いた障害物回避及びナビゲーション(A-20.スマートインフォメディアシステム,一般セッション)
- 1F-1 人間-ロボットの直感的なインタラクションのための発光視覚センサの提案(知的ヒューマンインタフェース,一般セッション,インタフェース)
- 2T-2 複数のカラー画像による低ビット領域の高精細化(圧縮・復元,学生セッション,人工知能と認知科学)
- 1302 伸縮アーム型壁面移動支援ロボットの開発(要旨講演,一般セッション:メカニカルシステムとその知能化)
- 家庭におけるコンピュータの利用活性化モデル-NARUTO
- 次回大会長挨拶
- C-3-27 近接物体のみを検知する光学デバイス(光記録・計測(I),C-3.光エレクトロニクス,一般講演)
- D-12-137 雲の動きを用いた衛星画像の雲分類(D-12.パターン認識・メディア理解,一般講演)
- D-14-11 擬音語と音響を用いた音響データベースの直感的な音探索(D-14.音声・聴覚,一般講演)
- ユーザを迷わせないマニュアルデザイン
- A-19-2 Passive RFIDを用いた自律移動ロボットのナビゲーション(A-19.福祉情報工学,一般講演)
- D-12-74 画像データの非線形主成分分析(D-12.パターン認識・メディア理解A)
- 非線形主成分分析による実世界データの解析(テーマセッション(2))(データマイニングとパターン認識・メディア理解)
- 主成分の順位を保持する非線形主成分分析法
- D-2-17 環境変化に高速に適応するニューラルネットワーク
- DCTコーディングに於けるノイズの除去
- 化学ロボットの実現を目指した自励振動ゲルアクチュエーターの創製
- 6T-6 演奏音全体からのフィードバックを有する即興演奏システム(音楽推薦・演奏支援,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- D-8-11 最適化のためのコード化変換(D-8.人工知能と知識処理,一般講演)
- ブラインドデコンポジションによるモノラル混合音の分離システム(システム論文特集号)
- 音楽音響信号を対象としたジェスチャによる音楽指揮システム(ソーシャルインタラクション及び一般)
- 非線形問題に対応可能な線形パーセプトロンの集団モデル(セッション3)
- IMSプロジェクト(HUTOP)におけるハプティックインタフェースの研究
- 尤度情報に基づく温度分布を用いた強化学習法
- 1P2-S-074 共生型レスキューロボットHoVITの基本性能評価(レスキューシステム・レスキュー工学3,生活を支援するロボメカ技術のメガインテグレーション)
- ロボティクスから見たバイオメトリクス
- ブラインドデコンポジションによるモノラル混合音の分離
- ノッチ幅・深さ・ロールオフ値の異なる時変ノッチ雑音のピッチ知覚
- 同位置に置かれたマイクロホンによる音源定位手法
- 同位置に置かれたマイクロホンによる音源定位手法(音情報学)
- FeelLight : 非言語情報通信のための双方向入出力デバイス(セッション5 : マルチモーダルデザイン(2))
- 同位置マイクロホンの伝達特性を利用したサウンドフォーカスと音源定位 : マイクロホンアレイとの比較(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- A-10-16 同位置に置かれた複数マイクの伝達特性を利用した音源定位手法(A-10. 応用音響)
- D-12-157 遠隔データベースを用いた自律移動ロボットによる物体認識(D-12. パターン認識・メディア理解B)
- D-11-136 画像データベースを用いた線情報復元(D-11.画像工学D)
- D-11-132 ビットレートの変化に対して頑健な動画像検索手法(D-11.画像工学D)
- D-8-10 エネルギー自給型屋外環境ロボット(D-8. 人工知能と知識処理)
- 同位置に置かれたマイクロホンの伝達特性を利用した音源定位手法
- 三次元CT画像を用いた現代日本人成人男女の頭部生体計測と顔面標準三次元物理モデルの構築
- 内容に基づく画像/映像情報の記述・検索とモバイルマルチメディア応用(モバイルマルチメディア化の発展と今後)
- 同位置に置かれた複数マイクの振幅特性を利用した音源分離手法
- 周波数スペクトルの反転に関する音響知覚
- A-4-19 ニューラルネットワークを用いた不等間隔標本化信号の内挿
- 曖昧語による適応型音響制御システム
- ディジタル画像を用いた高精度画像計測のための画像補正
- 共鳴部駆動による筝のエレキ化
- 正面顔画像からの輪郭特徴抽出
- 顔認識のための顔特徴抽出手法
- 握力インタフェースを用いた仮想楽器-GraspMIDI-の試作
- ベイジアンネットワークを使った曖昧な発話の意図を推定可能な家電制御システム
- 6C-4 位相空間のアフィン変換による物理系の適応的モデリングと機械学習への応用(ニューラルネット・マルチエージェント,一般セッション,人工知能と認知科学)
- D-8-10 マニピュレータロボットによる接近物体からの回避運動の学習(D-8.人工知能と知識処理,一般講演)
- D-12-58 花データベースの構築と絞込み検索
- D-12-152 3次元CGによる4次元データの提示方法に関する研究
- 情報機器の利用機会を増やす家庭内環境
- 情報機器利用スキル獲得プロセスに関する研究(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 情報機器利用スキル獲得プロセスに関する研究(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 2X-4 圧電素子を用いた目的音抽出法(音楽情報科学(1)音楽音響,学生セッション,人工知能と認知科学)
- 共鳴部駆動による筝のエレキ化
- 4次元視野制御を導入した4次元空間の可視化
- 個人の嗜好に基づく複数データの関連記述と対データの生成 : 嗜好を反映した配色システムを例として(テーマセッション「感性」(1),「手」,「感性情報処理」及びヒューマン情報処理一般)
- 個人の嗜好に基づく複数データの関連記述と対データの生成 : 嗜好を反映した配色システムを例として
- A-15-22 ワイヤレス把持インタフェースの試作(A-15.ヒューマン情報処理,一般セッション)
- 衛星画像を用いた雲分類とシーラスストリークの検出システム
- 既設コンクリート構造物におけるひび割れ幅の実画像計測
- D-11-125 パーコレーション処理による不特定形状特徴の抽出(D-11.画像工学D(画像処理・計測),一般講演)
- Gray-scale Hough変換を用いたコンクリート表面のひび割れ検出(一般セッション(2))
- Gray-scale Hough変換を用いたコンクリート表面のひび割れ検出(一般セッション(2))(CVのためのパターン認識・学習理論の新展開)
- A-10-12 インターネット上のサウンドデータベースの構築
- SMD-7 音響により直感的な検索を行う音響データベース
- SMD-7 音響により直感的な検索を行う音響データベース
- マルチモーダル検索型音響データベース
- 音響により検索する音響データベースの試み
- 音響データベースのマルチモーダル検索の試み : 音響によるデータ検索
- 4次元データを直感的に把握するためのVRシステム
- 2000-MUS-36-4 マルチモーダル情報を用いた仮想音楽環境
- ハンドジェスチャ入力デバイスによる音響生成