動画像に対応した背景音楽の自動生成システム
スポンサーリンク
概要
- 論文の詳細を見る
近年、テレビ・ビデオ等のAudio Visualメディアの充実にともなって、われわれは映像を見て、同時に音を聞いている。音のない映像を見ると、違和感さえ感じるものである。背景音楽(BGM)の多くは、作曲家によって作曲されており、簡単なBGMについても製作の自動化はほとんど行われていない。我々は、動画像から背景音楽を自動生成するシステムの制作を行っている。動画像から単純な構造的特徴を抽出し、これらをリアルタイムで音楽的特徴と結び付け、適当なメロディーを付加するシステムである。BGMを生成する試みは、これまでにも報告されているが、ここでは画像の内容に立ち入らず物理的な特徴のみに注目し、最終的に画像受信側に小さなアダプタを付加して、個人の好みに合わせた音楽を生成することを目的としている。本稿では、システム構成の概要とサンプル動画像を用いた音楽生成の結果を報告する。
- 一般社団法人情報処理学会の論文
- 1996-03-06
著者
-
橋本 周司
早稲田大学理工学術院 先進理工学研究科
-
田中 章喜
松下技研株式会社画像情報研究所
-
張 汀汀
早稲田大学理工学部応用物理学科
-
田中 章喜
松下技研株式会社
-
橋本 周司
早稲田大学
-
尾上 直之
早稲田大学
-
張 汀汀
早稲田大学 理工学部
-
尾上 直之
早稲田大学理工学研究科
関連論文
- The Japanese Society of Hypertension Committee for Guidelines for the Management of Hypertension
- The association between masked hypertension and waist circumference as an obesity-related anthropometric index for metabolic syndrome : the Ohasama study
- A-15-21 積荷をインターフェースとしたクローラ・車輪型搬送ロボットDai-shaの開発(A-15.ヒューマン情報処理,一般セッション)
- 次回大会長挨拶
- Steroid resistance in prolonged type I membranoproliferative glomerulonephritis and accelerated disease remission after steroid withdrawal
- 1ZA-1 ディジタルミラーの開発(VRシステム,学生セッション,インタフェース)
- F08(3) 感性インタフェースをデザインする(【F08】ヒューマンインタフェースデザインのフロンティア)
- Proposal of a Risk-Stratification System for the Japanese Population Based on Blood Pressure Levels : The Ohasama Study
- Reproducibility of Nocturnal Blood Pressure Assessed by Self-Measurement of Blood Pressure at Home
- Increase of Colon and Rectal Cancer Incidence Rates in Japan: Trends in Incidence Rates in Miyagi Prefecture, 1959-1997
- 主成分の順位を保持する非線形主成分分析(情報論的学習理論論文小特集)
- 最適化のための粗視化ニュートン法
- 声道モデルの機械系による実現とその計算機制御
- 適応型歌声自動伴奏システム
- 歌声のピッチ検出による自動伴奏システム
- 快適生活支援RTシステムの開発
- 6-3 ロボットの感性化 : 人に優しいロボット(6.感性の産業応用,感性情報学)
- 情報機器利用スキル獲得プロセスに関する研究
- 人間と機械の新しい関係 : ワセダのロボットたち
- 情報機器利用スキル獲得プロセスに関する研究(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 早稲田大学先進理工学部応用物理学科 : 橋本研究室
- 3W-1 意味センサネットワークを用いたロボットシステムの制御(ロボットと社会インフラ,学生セッション,ネットワーク)
- 2301 人工構造物における受動的な自己増殖の実現(要旨講演,一般セッション:マイクロナノ理工学)
- 1303 急加速度状況での上半身運動によるロポットのバランス制御の試み(要旨講演,一般セッション:メカニカルシステムとその知能化)
- 6ZD-8 "意味"を伝達するセンサネットワークの提案(アバタ・エージェント・ロボット,学生セッション,インターフェース)
- 2ZC-2 可視光ビームインタフェースを用いた生活空間の提案(インタラクティブデザイン,学生セッション,インターフェース)
- 3W-5 カメラ動きパラメータのクラスタリングによる動視点からの動物体検出(動画像・メディア理解,学生セッション,人工知能と認知科学)
- 2V-7 距離画像とカラー画像のセンサフュージョンに基づくロボットの人間追従(3次元画像処理,学生セッション,人工知能と認知科学)
- ロボットと画像計測・認識
- 連想型自己組織化マップを用いたリズム演奏支援システム(音楽情報,インタラクションの理解とデザイン)
- Passive RFIDを用いた自律移動ロボットのナビゲーション(留学生による日本語技術論文)
- A-20-14 RFIDを用いた障害物回避及びナビゲーション(A-20.スマートインフォメディアシステム,一般セッション)
- 1F-1 人間-ロボットの直感的なインタラクションのための発光視覚センサの提案(知的ヒューマンインタフェース,一般セッション,インタフェース)
- 2T-2 複数のカラー画像による低ビット領域の高精細化(圧縮・復元,学生セッション,人工知能と認知科学)
- 1302 伸縮アーム型壁面移動支援ロボットの開発(要旨講演,一般セッション:メカニカルシステムとその知能化)
- 家庭におけるコンピュータの利用活性化モデル-NARUTO
- Blood Pressure, Levels of Serum Lipids, Liver Enzymes and Blood Glucose by Aldehyde Dehydrogenase 2 and Drinking Habit in Japanese Men
- Colorectal Cancer and Serum C-reactive Protein Levels : a Case-control Study Nested in the JACC Study
- Glucose Intolerance and Colorectal Cancer Risk in a Nested Case-Control Study among Japanese People
- Alcohol Consumption and Colorectal Cancer Risk : Findings from the JACC Study
- Medical History of Circulatory Diseases and Colorectal Cancer Death in the JACC Study
- Preface
- Stability of Frozen Serum Levels of Insulin-like Growth Factor-I, Insulin-like Growth Factor-II, Insulin-like Growth Factor Binding Protein-3, Transforming Growth Factorβ, Soluble Fas, and Superoxide Dismutase Activity for the JACC Study
- High Ratio of Myeloid Dendritic Cells to Plasmacytoid Dendritic Cells in Blood of Patients With Acute Coronary Syndrome
- 次回大会長挨拶
- C-3-27 近接物体のみを検知する光学デバイス(光記録・計測(I),C-3.光エレクトロニクス,一般講演)
- 環境知能化とロボット技術 (特集 環境知能化)
- D-12-137 雲の動きを用いた衛星画像の雲分類(D-12.パターン認識・メディア理解,一般講演)
- D-14-11 擬音語と音響を用いた音響データベースの直感的な音探索(D-14.音声・聴覚,一般講演)
- Activities of Daily Living, Functional Capacity, and Life Satisfaction of Subacute Myelo-Optico-Neuropathy Patients in Japan
- ユーザを迷わせないマニュアルデザイン
- A-19-2 Passive RFIDを用いた自律移動ロボットのナビゲーション(A-19.福祉情報工学,一般講演)
- D-12-74 画像データの非線形主成分分析(D-12.パターン認識・メディア理解A)
- 非線形主成分分析による実世界データの解析(テーマセッション(2))(データマイニングとパターン認識・メディア理解)
- 主成分の順位を保持する非線形主成分分析法
- D-2-17 環境変化に高速に適応するニューラルネットワーク
- DCTコーディングに於けるノイズの除去
- 化学ロボットの実現を目指した自励振動ゲルアクチュエーターの創製
- Reduced risk of endometrial cancer from alcohol drinking in Japanese
- Smoking and Drinking Habits Five Years after Baseline in the JACC Study
- Change in Food Intake Frequency at Five Years after Baseline in the JACC Study
- Metabolomic profiling of uremic solutes in CKD patients
- 6T-6 演奏音全体からのフィードバックを有する即興演奏システム(音楽推薦・演奏支援,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- D-8-11 最適化のためのコード化変換(D-8.人工知能と知識処理,一般講演)
- ブラインドデコンポジションによるモノラル混合音の分離システム(システム論文特集号)
- 音楽音響信号を対象としたジェスチャによる音楽指揮システム(ソーシャルインタラクション及び一般)
- 非線形問題に対応可能な線形パーセプトロンの集団モデル(セッション3)
- IMSプロジェクト(HUTOP)におけるハプティックインタフェースの研究
- 尤度情報に基づく温度分布を用いた強化学習法
- 1P2-S-074 共生型レスキューロボットHoVITの基本性能評価(レスキューシステム・レスキュー工学3,生活を支援するロボメカ技術のメガインテグレーション)
- ロボティクスから見たバイオメトリクス
- ブラインドデコンポジションによるモノラル混合音の分離
- ノッチ幅・深さ・ロールオフ値の異なる時変ノッチ雑音のピッチ知覚
- 同位置に置かれたマイクロホンによる音源定位手法
- 同位置に置かれたマイクロホンによる音源定位手法(音情報学)
- FeelLight : 非言語情報通信のための双方向入出力デバイス(セッション5 : マルチモーダルデザイン(2))
- 同位置マイクロホンの伝達特性を利用したサウンドフォーカスと音源定位 : マイクロホンアレイとの比較(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- A-10-16 同位置に置かれた複数マイクの伝達特性を利用した音源定位手法(A-10. 応用音響)
- D-12-157 遠隔データベースを用いた自律移動ロボットによる物体認識(D-12. パターン認識・メディア理解B)
- D-11-136 画像データベースを用いた線情報復元(D-11.画像工学D)
- D-11-132 ビットレートの変化に対して頑健な動画像検索手法(D-11.画像工学D)
- D-8-10 エネルギー自給型屋外環境ロボット(D-8. 人工知能と知識処理)
- 同位置に置かれたマイクロホンの伝達特性を利用した音源定位手法
- 研究室紹介 橋本周司研究室(早稲田大学)
- ヒューマノイドロボットの実現へ向けて : 実装技術への課題(ロボット)
- 顔のモデリングと認識(オーガナイズドセッション「顔」(3)-モデリングと顔認識-)
- 三次元CT画像を用いた現代日本人成人男女の頭部生体計測と顔面標準三次元物理モデルの構築
- 内容に基づく画像/映像情報の記述・検索とモバイルマルチメディア応用(モバイルマルチメディア化の発展と今後)
- 同位置に置かれた複数マイクの振幅特性を利用した音源分離手法
- 周波数スペクトルの反転に関する音響知覚
- スマートハウス : 情報技術とメカトロ技術がつくる新しい住環境(「スマートハウスの現状と将来」)
- A-4-19 ニューラルネットワークを用いた不等間隔標本化信号の内挿
- 二足歩行ロボットASIMO : 広瀬真人氏に聞く(ロボットと文化)(ロボット)
- 人間と共生するロボットの実現へ向けて(ロボット)
- ロボット
- 曖昧語による適応型音響制御システム
- ディジタル画像を用いた高精度画像計測のための画像補正
- D-12-146 統計量を用いた3次元形状データ間の自動位置合わせ
- 共鳴部駆動による筝のエレキ化
- 正面顔画像からの輪郭特徴抽出