母音認謙とピッチ検出による歌声のテンポ抽出
スポンサーリンク
概要
- 論文の詳細を見る
あずま,えいじ,おのえ,なおゆき,はしもと,しゅうじ我々はこれまで歌声のテンポに合わせて演奏する自動伴奏システムを試作してきた。そこでは歌声のテンポを抽出するために、ピッチの検出結果とメロディデータとをマッチングする手法と母音の認識結果と歌詞データとをマッチングする手法という2通りの手法を扱っていた。しかし、同じ母音やピッチが連続して現れる箇所では、テンポ追従が困難であった。そこで現在は、母音とピッチの情報を複合して用いることにより、細かい歌唱位置の判定を目指している。母音とピッチの認識にはD S Pを使わず Macintosh 内蔵の Sound-Input-Device を使用し、主にケプストラム法を用いて行っている。特にピッチ検出では歌声の基本周波数の倍音構造に注目した手法を用いることでローパスフィルタも不要になった。これらにより、マイクとMIDI音源さえあれば手軽に自動伴奏が行えるという見通しを得たので報告する。
- 1997-03-12
著者
関連論文
- A-15-21 積荷をインターフェースとしたクローラ・車輪型搬送ロボットDai-shaの開発(A-15.ヒューマン情報処理,一般セッション)
- 1ZA-1 ディジタルミラーの開発(VRシステム,学生セッション,インタフェース)
- F08(3) 感性インタフェースをデザインする(【F08】ヒューマンインタフェースデザインのフロンティア)
- 主成分の順位を保持する非線形主成分分析(情報論的学習理論論文小特集)
- 最適化のための粗視化ニュートン法
- 声道モデルの機械系による実現とその計算機制御
- 適応型歌声自動伴奏システム
- 歌声のピッチ検出による自動伴奏システム
- 快適生活支援RTシステムの開発
- 6-3 ロボットの感性化 : 人に優しいロボット(6.感性の産業応用,感性情報学)
- 情報機器利用スキル獲得プロセスに関する研究
- 人間と機械の新しい関係 : ワセダのロボットたち
- 情報機器利用スキル獲得プロセスに関する研究(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 早稲田大学先進理工学部応用物理学科 : 橋本研究室
- 3W-1 意味センサネットワークを用いたロボットシステムの制御(ロボットと社会インフラ,学生セッション,ネットワーク)
- 1303 急加速度状況での上半身運動によるロポットのバランス制御の試み(要旨講演,一般セッション:メカニカルシステムとその知能化)
- 6ZD-8 "意味"を伝達するセンサネットワークの提案(アバタ・エージェント・ロボット,学生セッション,インターフェース)
- 2ZC-2 可視光ビームインタフェースを用いた生活空間の提案(インタラクティブデザイン,学生セッション,インターフェース)
- 3W-5 カメラ動きパラメータのクラスタリングによる動視点からの動物体検出(動画像・メディア理解,学生セッション,人工知能と認知科学)
- 2V-7 距離画像とカラー画像のセンサフュージョンに基づくロボットの人間追従(3次元画像処理,学生セッション,人工知能と認知科学)
- ロボットと画像計測・認識
- 連想型自己組織化マップを用いたリズム演奏支援システム(音楽情報,インタラクションの理解とデザイン)
- Passive RFIDを用いた自律移動ロボットのナビゲーション(留学生による日本語技術論文)
- A-20-14 RFIDを用いた障害物回避及びナビゲーション(A-20.スマートインフォメディアシステム,一般セッション)
- 1F-1 人間-ロボットの直感的なインタラクションのための発光視覚センサの提案(知的ヒューマンインタフェース,一般セッション,インタフェース)
- 2T-2 複数のカラー画像による低ビット領域の高精細化(圧縮・復元,学生セッション,人工知能と認知科学)
- 1302 伸縮アーム型壁面移動支援ロボットの開発(要旨講演,一般セッション:メカニカルシステムとその知能化)
- 家庭におけるコンピュータの利用活性化モデル-NARUTO
- 次回大会長挨拶
- C-3-27 近接物体のみを検知する光学デバイス(光記録・計測(I),C-3.光エレクトロニクス,一般講演)
- D-12-137 雲の動きを用いた衛星画像の雲分類(D-12.パターン認識・メディア理解,一般講演)
- D-14-11 擬音語と音響を用いた音響データベースの直感的な音探索(D-14.音声・聴覚,一般講演)
- ユーザを迷わせないマニュアルデザイン
- A-19-2 Passive RFIDを用いた自律移動ロボットのナビゲーション(A-19.福祉情報工学,一般講演)
- D-12-74 画像データの非線形主成分分析(D-12.パターン認識・メディア理解A)
- 非線形主成分分析による実世界データの解析(テーマセッション(2))(データマイニングとパターン認識・メディア理解)
- 主成分の順位を保持する非線形主成分分析法
- D-2-17 環境変化に高速に適応するニューラルネットワーク
- DCTコーディングに於けるノイズの除去
- 化学ロボットの実現を目指した自励振動ゲルアクチュエーターの創製
- 6T-6 演奏音全体からのフィードバックを有する即興演奏システム(音楽推薦・演奏支援,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- D-8-11 最適化のためのコード化変換(D-8.人工知能と知識処理,一般講演)
- ブラインドデコンポジションによるモノラル混合音の分離システム(システム論文特集号)
- 音楽音響信号を対象としたジェスチャによる音楽指揮システム(ソーシャルインタラクション及び一般)
- 非線形問題に対応可能な線形パーセプトロンの集団モデル(セッション3)
- IMSプロジェクト(HUTOP)におけるハプティックインタフェースの研究
- 尤度情報に基づく温度分布を用いた強化学習法
- 1P2-S-074 共生型レスキューロボットHoVITの基本性能評価(レスキューシステム・レスキュー工学3,生活を支援するロボメカ技術のメガインテグレーション)
- ロボティクスから見たバイオメトリクス
- ブラインドデコンポジションによるモノラル混合音の分離
- ノッチ幅・深さ・ロールオフ値の異なる時変ノッチ雑音のピッチ知覚
- 同位置に置かれたマイクロホンによる音源定位手法
- 同位置に置かれたマイクロホンによる音源定位手法(音情報学)
- FeelLight : 非言語情報通信のための双方向入出力デバイス(セッション5 : マルチモーダルデザイン(2))
- 同位置マイクロホンの伝達特性を利用したサウンドフォーカスと音源定位 : マイクロホンアレイとの比較(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- A-10-16 同位置に置かれた複数マイクの伝達特性を利用した音源定位手法(A-10. 応用音響)
- D-12-157 遠隔データベースを用いた自律移動ロボットによる物体認識(D-12. パターン認識・メディア理解B)
- D-11-136 画像データベースを用いた線情報復元(D-11.画像工学D)
- D-11-132 ビットレートの変化に対して頑健な動画像検索手法(D-11.画像工学D)
- D-8-10 エネルギー自給型屋外環境ロボット(D-8. 人工知能と知識処理)
- 同位置に置かれたマイクロホンの伝達特性を利用した音源定位手法
- 三次元CT画像を用いた現代日本人成人男女の頭部生体計測と顔面標準三次元物理モデルの構築
- 内容に基づく画像/映像情報の記述・検索とモバイルマルチメディア応用(モバイルマルチメディア化の発展と今後)
- 同位置に置かれた複数マイクの振幅特性を利用した音源分離手法
- 周波数スペクトルの反転に関する音響知覚
- A-4-19 ニューラルネットワークを用いた不等間隔標本化信号の内挿
- 曖昧語による適応型音響制御システム
- ディジタル画像を用いた高精度画像計測のための画像補正
- 共鳴部駆動による筝のエレキ化
- 正面顔画像からの輪郭特徴抽出
- 顔認識のための顔特徴抽出手法
- 握力インタフェースを用いた仮想楽器-GraspMIDI-の試作
- ベイジアンネットワークを使った曖昧な発話の意図を推定可能な家電制御システム
- 6C-4 位相空間のアフィン変換による物理系の適応的モデリングと機械学習への応用(ニューラルネット・マルチエージェント,一般セッション,人工知能と認知科学)
- D-8-10 マニピュレータロボットによる接近物体からの回避運動の学習(D-8.人工知能と知識処理,一般講演)
- D-12-58 花データベースの構築と絞込み検索
- D-12-152 3次元CGによる4次元データの提示方法に関する研究
- 情報機器の利用機会を増やす家庭内環境
- 情報機器利用スキル獲得プロセスに関する研究(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 情報機器利用スキル獲得プロセスに関する研究(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 2X-4 圧電素子を用いた目的音抽出法(音楽情報科学(1)音楽音響,学生セッション,人工知能と認知科学)
- 共鳴部駆動による筝のエレキ化
- 4次元視野制御を導入した4次元空間の可視化
- 個人の嗜好に基づく複数データの関連記述と対データの生成 : 嗜好を反映した配色システムを例として(テーマセッション「感性」(1),「手」,「感性情報処理」及びヒューマン情報処理一般)
- 個人の嗜好に基づく複数データの関連記述と対データの生成 : 嗜好を反映した配色システムを例として
- A-15-22 ワイヤレス把持インタフェースの試作(A-15.ヒューマン情報処理,一般セッション)
- 衛星画像を用いた雲分類とシーラスストリークの検出システム
- 既設コンクリート構造物におけるひび割れ幅の実画像計測
- D-11-125 パーコレーション処理による不特定形状特徴の抽出(D-11.画像工学D(画像処理・計測),一般講演)
- Gray-scale Hough変換を用いたコンクリート表面のひび割れ検出(一般セッション(2))
- Gray-scale Hough変換を用いたコンクリート表面のひび割れ検出(一般セッション(2))(CVのためのパターン認識・学習理論の新展開)
- A-10-12 インターネット上のサウンドデータベースの構築
- SMD-7 音響により直感的な検索を行う音響データベース
- SMD-7 音響により直感的な検索を行う音響データベース
- マルチモーダル検索型音響データベース
- 音響により検索する音響データベースの試み
- 音響データベースのマルチモーダル検索の試み : 音響によるデータ検索
- 4次元データを直感的に把握するためのVRシステム
- 2000-MUS-36-4 マルチモーダル情報を用いた仮想音楽環境
- ハンドジェスチャ入力デバイスによる音響生成