画像視覚特性に基づく旋律自動生成の高度化に関する一検討
スポンサーリンク
概要
- 論文の詳細を見る
音楽付写真スライドショーが広く使用されているが、独立して作成された写真と音楽を同時に再生するだけでなく,視覚と聴覚の感覚が適合する提示ができれば,魅力的なサービスとなる.また,視覚に合わせて音楽が自動生成できれば,手軽に音楽付写真スライドショーを楽しめる.筆者らは,写真データを画像解析して視覚効果を自動付与し,付与された視覚効果に対応する旋律を自動生成して提示する写真再生システムを構築した.しかし,同システムでは,単音のみの旋律生成に止まっており,音楽表現が乏しいという課題があった.そこで本報告では,音楽のジャンルを予め指定し,多楽器で構成される伴奏と共に高度な旋律を生成することで,より豊かな音楽表現を可能とした写真再生システムを提案する.また,提案システムにおいて,主観評価試験を実施したので報告する.
- 2013-02-15
著者
-
酒澤 茂之
株式会社KDDI研究所
-
明堂 絵美
株式会社KDDI研究所
-
酒澤 茂之
(株)KDDI研究所
-
愛澤 伯友
デジタルハリウッド大学
-
酒澤 茂之
株式会社KDDI研究所メディアソリューショングループ
関連論文
- 1/4画素精度動き補償を併用したMPEG-1動画像のロスレス再符号化 (画像工学)
- コンテンツ/シーンナビゲーションのための直感的サムネイル抽出(コンシューマ,映像メディアおよび一般)
- 算術符号を用いたMPEG-1動画像のロスレス再符号化
- D-11-24 4:4:4映像符号化におけるチャネル間予測の一検討(D-11.画像工学,一般セッション)
- MPEGフレーム内予測を利用した局所領域ビデオスクランブル(映像メディア処理,感性情報工学及び一般)
- ネットワーク映像メディア(メディア情報,映像情報メディア年報)
- H.264のIntra予測残差に対する適応的チャネル間予測 (論文特集 画像処理・符号化とアプリケーション)
- シーンモデルを利用した移動カメラキャリブレーション方式(一般セッション3)
- シーンモデルを利用した移動カメラキャリブレーション方式(一般セッション1,三次元画像,多視点画像)
- 視点間の整合性を考慮した3次元モデルフィードバック型背景分離方式の不要部除去拡張(ライフログ活用技術,オフィス情報システム,マルチメディアシステム,マルチメディア通信,IP放送/映像伝送,一般)
- 視点間の整合性を考慮した3次元モデルフィードバック型背景分離方式の不要部除去拡張(画像工学,ライフログ活用技術,オフィス情報システム,マルチメディアシステム,マルチメディア通信,IP放送/映像伝送,一般)
- 自由視点立体映像生成のための効率的な光線情報伝送手法(立体映像技術一般)
- ウォークスルーを実現するための自由視点映像合成方式(画像認識,コンピュータビジョン)
- ウォークスルーを実現する自由視点映像合成方式(テーマ関連オーガナイズドセッション1)
- D-11-10 局所領域分割を用いた自由視点映像の縦方向視点移動における視差の補正手法(D-11. 画像工学,一般セッション)
- ウォークスルーを実現する自由視点映像合成方式(テーマ関連オーガナイズドセッション1,三次元画像,多視点画像)
- I-075 局所領域分割を用いた自由視点映像生成におけるデータ圧縮手法(I分野:グラフィクス・画像)
- コンテンツ/シーンナビゲーションのための直感的サムネイル抽出
- 画面分割JPEG2000符号化に基づくHDTVコーデックの低遅延性評価(画像・映像処理)
- D-12-43 映像コンテンツからの検索窓高精度抽出法(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- メディア工学シンポジウム聴講報告
- D-11-31 誤差拡散割符の最適パラメータ設定に関する一検討(D-11.画像工学A(画像基礎・符号化),一般講演)
- MPEG-2符号化領域における電子透かしの高度化について
- Void-and-Cluster 法閾値マトリクスを用いた高速高画質割符生成方式
- Void-and-Cluster法閾値マトリクスを用いた高速高画質割符生成方式(マルチメディアシステムの品質, 一般)
- J-030 VC法を用いた高速高画質電子割符生成法の拡張(J分野:グラフィクス・画像)
- LG-002 MDCT係数操作によるオーディオ電子透かしの音質劣化抑制(G分野:音声・音楽)
- D-11-11 void-and-cluster法を利用した高速電子割符生成方式(D-11. 画像工学A(画像基礎・符号化), 情報・システム2)
- 電子透かし技術MPmarkの非圧縮ドメインにおける透かし検出
- MPEG符号化領域で埋め込み可能な動画像電子透かし方式
- 階層型ビデオマルチキャストにおける帯域測定のためのプローブパケットの利用
- メディア符号化・伝送・表示
- MPEG符号化領域で埋め込み可能な動画像電子透かし方式(高精細画像の処理・表示,及び一般)
- 階層型ビデオマルチキャストにおける帯域測定のためのプローブパケットの利用(高精細画像の処理・表示,及び一般)
- 超高精細映像符号化におけるマクロブロックサイズ拡張手法に関する一検討(符号化,映像符号化,システム及び一般)
- 超高精細映像メディアの配信技術に関わる最新動向(ディジタル・情報家電,放送用,ゲーム機用システムLSI,回路技術(一般,超高速・低電力・高機能を目指した新アーキテクチャ))
- 視差マップを用いた3Dモデルの反復生成アプローチ(画像符号化,通信・ストリーム技術,一般)
- 視差マップを用いた3Dモデルの反復生成アプローチ(画像符号化,通信・ストリーム技術,及び一般)
- 視差マップを用いた3Dモデルの反復生成アプローチ(画像符号化,通信・ストリーム技術,及び一般)
- 視差マップを用いた3Dモデルの反復生成アプローチ(画像符号化,通信・ストリーム技術,及び一般)
- ウォークスルーを実現する自由視点映像合成方式(テーマ関連オーガナイズドセッション1,三次元画像,多視点画像)
- シーンモデルを利用した移動カメラキャリブレーション方式(一般セッション1,三次元画像,多視点画像)
- マルチカメラシステムにおける最適色補正方式(高精細画像の処理・表示及び一般)
- ネットワーク映像メディア(画像情報工学)(映像情報メディア年報)
- 予測誤差信号の振幅特性に基づく低処理コストなAdaptive Interpolation Filter設計手法
- D-11-16 MPEG-1動画像のロスレス再符号化 : 多峰性確率モデルによる動ベクトルの符号量削減(D-11.画像工学,一般セッション)
- 時間方向視覚特性に基づく高フレームレート画像符号化方式の一検討
- 1/4画素精度動き補償を併用したMPEG-1動画像のロスレス再符号化(画像再構成・映像符号化,視覚情報処理,画像メディア処理・符号化,一般)
- AS-4-4 IPTVにおけるQoE測定に適した品質要素の抽出(AS-4.イメージメディアクオリティの基盤技術,シンポジウムセッション)
- Void-and-Cluster法閾値マトリクスを用いた高速高画質割符生成方式(マルチメディアシステムの品質, 一般)
- Void-and-Cluster法閾値マトリクスを用いた高速高画質割符生成方式(マルチメディアシステムの品質, 一般)
- 電子透かし技術MPmarkの非圧縮ドメインにおける透かし検出
- マルチキャスト環境における帯域測定について
- 階層型ビデオマルチキャストにおけるJoin-Experimentの改善と複数ストリームの協調制御
- D-11-94 マルチTCPコネクション伝送における網輻輳の影響評価
- 算術符号を用いたMPEG-1動画像のロスレス再符号化
- LJ-8 電子透かし攻撃ツールStirMarkの動画像品質に及ぼす影響(J. グラフィクス・画像)
- 確率尤度を用いた3次元形状モデル投影型背景分離方式
- D-12-79 大空間カメラ配置における幾何情報に基づく仮想視点画像生成法の一検討(D-12.パターン認識・メディア理解,一般セッション)
- 視点間の整合性を考慮した3次元モデルフィードバック型背景分離方式の不要部除去拡張
- 視点間の整合性を考慮した3次元モデルフィードバック型背景分離方式の不要部除去拡張(画像工学,ライフログ活用技術,オフィス情報システム,マルチメディアシステム,マルチメディア通信,IP放送/映像伝送,一般)
- 超高精細映像におけるマクロブロックサイズ拡張手法に関する解析的考察
- D-11-84 多視点映像符号化効率に対する色補正処理の影響に関する検討(D-11.画像工学,一般セッション)
- D-11-1 ドリフト補償を伴ったMPEGストリームへの直接電子透かし挿入方式(D-11.画像工学A)
- 3G携帯電話による定点カメラ映像視聴システム"ezmonitor "
- D-11-35 MPEG ストリームへの電子透かし埋め込みに関する一検討
- TCPビデオストリーミングの動的レート制御方式の検討(高精細画像の処理・表示および一般)
- TCPビデオストリーミングの動的レート制御方式の検討
- 12-6 アニメーション画像のモデル化にもとづく抽出方法の一検討
- 1-8 携帯電話ビデオ配信用コンテンツ制作システムの開発 : テロップテキストフオーマット
- D-11-1 予測誤差信号の振幅特性を考慮したAdaptive Interpolation Filterに対する処理量削減手法(D-11.画像工学,一般セッション)
- D-11-55 高フレームレート映像符号化におけるスキップ符号化モードの性能改善に関する一検討(D-11.画像工学,一般セッション)
- D-11-85 被写体3次元モデルの各撮影視点へのフィードバック処理に基づく背景分離方式(D-11.画像工学,一般セッション)
- ケーブルテレビを中心とした映像メディアサービス標準化動向(モバイル/放送融合技術・システム及びアプリケーション品質,モバイルコンテンツ,モバイル映像配信, P2P/アドホックネットワーク,一般)
- ケーブルテレビを中心とした映像メディアサービス標準化動向(招待講演,学生特別セッション,モバイル/放送融合技術・システム及びアプリケーション品質,モバイルコンテンツ,モバイル映像配信,P2P/アドホックネットワーク,一般)
- H-035 コンシューマビデオのジャンル分類方式に関する検討(画像認識・メディア理解,一般論文)
- H.264の Intra 予測残差に対する適応的チャネル間予測
- RI-005 メディアン予測の最適制御に基づくMPEG-4 AVC/H.264動きベクトル予測の性能改善(グラフィクス・画像,査読付き論文)
- テクスチャの再現性を考慮したH.264符号化モード制御方式
- 近傍符号化画像の周波数成分を考慮したイントラ予測拡張方式(一般)
- テクスチャの再現性を考慮したH.264符号化モード選択方式(チュートリアル)
- Webベース動画像蓄積伝送システムVAST-webの開発
- H.264のIntra予測残差に対する適応的チャネル間予測
- I-054 簡易カメラ校正に基づく大空間自由視点映像の高精度合成方式(I分野:グラフィクス・画像,一般論文)
- 2. 動画像電子透かし
- エラー環境下におけるSVFTPプロトコルの伝送性能の理論検討
- D-11-68 円周配置カメラ映像を用いた背景の自由視点画像生成(D-11.画像工学D(画像処理・計測),一般講演)
- J_014 マルチメディアアプリケーション映像品質の自動客観評価法の精度改善の検討(J分野:グラフィクス・画像)
- 超高精細映像におけるマクロブロックサイズ拡張手法に関する解析的考察
- I-047 超高精細映像符号化におけるマクロブロックサイズの局所適応選択手法(グラフィクス・画像,一般論文)
- H.264の Intra 予測残差に対する適応的変換基底関数を用いた映像符号化方式
- D-12-93 局所特徴の時間的バースト性を考慮した準同一映像検出(D-12.パターン認識・メディア理解,一般セッション)
- D-11-10 JPEG画像のロスレス再符号化のためのDCT係数のモデル化に関する一検討(D-11.画像工学,一般セッション)
- D-12-34 DTWを用いた動きのリズム評価に関する一検討(D-12.パターン認識・メディア理解,一般セッション)
- 大域・局所画像特徴および音響特徴を用いた高精度なコピー検出手法(テーマセッション,映像処理とTRECVID)
- ビル壁面の規則的テクスチャを利用した鳥瞰・街並画像からのビル領域抽出手法(一般セッション,映像処理とTRECVID)
- 照明による輝度変化の影響を考慮した携帯端末用ネイルアートシミュレーションに関する検討(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- 照明による輝度変化の影響を考慮した携帯端末用ネイルアートシミュレーションに関する検討(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- 招待講演 超高精細映像メディアの配信技術に関わる最新動向 (コンシューマエレクトロニクス)
- 主成分分析によるダンス映像からのリズム抽出と評価(知的マルチメディアシステム,一般)