事例に基づく映像ショット列への音楽付与(テーマセッション,クロスモーダル)
スポンサーリンク
概要
- 論文の詳細を見る
専門家の主な編集技法として,動画・音響・トランジション効果などの複数のメディアストリームを,視覚的・聴覚的印象が調和するように組み合わせることにより,編集された映像の質を相乗的に高めるというものがある.本研究では,専門家が制作した編集映像である事例映像における動画及び音響の低レベル特徴の共起関係や変化パターンに基づき,素材となるショット列に対し,1)適切な音楽の検索,2)音楽における聴覚的変化点である音響境界の抽出,3)ショットの冗長な部分を削除した編集区間の抽出,4)トランジション効果の付与,により,視覚的・聴覚的印象が調和した編集映像を半自動的に生成する手法を提案する.
- 2010-01-14
著者
-
馬場口 登
大阪大学大学院工学研究科
-
新田 直子
大阪大学 大学院工学研究科
-
馬場口 登
大阪大学 大学院 工学研究科
-
新田 直子
大阪大学大学院工学研究科
-
新田 直子
大阪大学大学院基礎工学研究科情報数理系専攻
-
金 壯一
大阪大学大学院工学研究科
-
馬場 口登
大阪大学産業科学研究所
関連論文
- 視覚的なプライバシー・センシティブ情報とその処理(監視社会におけるプライバシー保護のあり方)
- 5.パターン認識・メディア理解の10大チャレンジテーマ(パターン認識・メディア理解のグランドチャレンジ)
- 番組紹介テキストの特徴に基づく番組紹介スポットの自動生成
- モデル検査ツールによるポリシー整合性検証(セッション10-C : セキュリティマネジメント(3))
- 移動軌跡を用いた歩行者間の人間関係の推定(テーマ関連セッション8,コンピュータビジョンとパターン認識のための学習理論)
- 移動軌跡を用いた歩行者間の人間関係の推定(テーマ関連セッション8)
- 参加者のインタラクションを可視化したマルチメディア議事録の作成(一般セッション5)
- 参加者のインタラクションを可視化したマルチメディア議事録の作成(一般セッション2,三次元画像,多視点画像)
- マルチメディア検索の技術動向
- テレビ視聴行動からの個人的選好獲得(一般セッション5)
- テレビ視聴行動からの個人的選好獲得(一般セッション2,三次元画像,多視点画像)
- 公共空間における行動の階層性に基づく非正常行動検出 (パターン認識・メディア理解)
- D-11-112 パノラマ及び透視投影変換後も情報抽出可能な全方位画像の電子透かし(D-11.画像工学D)
- 適合性フィードバックを用いた顔の経年変化を含む人物画像検索(一般セッション5,コンピュータビジョンとパターン認識のための学習理論)
- インターモーダル協調によるアメリカンフットボール映像の自動パーシング(マルチメディアとパターン認識理解,一般)
- 適合性フィードバックを用いた顔の経年変化を含む人物画像検索(一般セッション5)
- 状況依存モデルを用いた異常行動の検出(一般,膨大なデータから学ぶもの)
- 6. ネットワークロボットのセンシングとプライバシー保護技術(ネットワークロボット最前線)
- 監視カメラ映像におけるGPS端末携帯ユーザの同定と追跡(一般セッション11)
- 映像サーベイランスにおけるプライバシー保護のための視覚的抽象化の提案(一般セッション8)
- 監視カメラ映像におけるGPS端末携帯ユーザの同定と追跡(一般セッション(5),CVのためのパターン認識・学習理論の新展開)
- 映像サーベイランスにおけるプライバシー保護のための視覚的抽象化の提案(一般セッション(5),CVのためのパターン認識・学習理論の新展開)
- 映像処理評価用映像データベースについて
- DS-3-1 音響電子透かしを用いた屋内での録音位置推定(DS-3.マルチメディア情報ハイディング,シンポジウムセッション)
- 隣接行列を用いたアクセス制御ポリシーの統合法(セッション2)
- モデル検査ツールによるポリシー整合性検証(セッション10-C : セキュリティマネジメント(3))
- D-12-40 共起人物を考慮した人物画像検索(D-12.パターン認識・メディア理解,一般セッション)
- 事例映像への適合度と知覚品質に基づくホームビデオ編集支援 (ヒューマン情報処理)
- 事例映像への適合度と知覚品質に基づくホームビデオ編集支援 (パターン認識・メディア理解)
- DS-3-3 可逆型プライバシー保護画像処理(DS-3.マルチメディア情報ハイディング,シンポジウムセッション)
- 観測型実世界コンテンツ : ディジタルジオラマ(センシングウェブ)
- 部分映像挿入による時間軸上の映像補完
- 映像編集のための事例学習に基づく素材映像からのショット列生成(一般セッション5)
- D-12-80 イメージモザイキングを用いた仮想カメラワークの生成(D-12. パターン認識・メディア理解,一般セッション)
- D-12-66 オブジェクト同定のための照明変動を考慮したSIFT特徴量の洗練化(D-12. パターン認識・メディア理解,一般セッション)
- RFIDタグとカメラ映像を用いたサーベイランス映像中の人物同定(日本語セッション1,第二回日韓パターン認識ワークショップ(KJPR))
- 放送型スポーツ映像の意味内容獲得のためのストーリー分割法(マルチメディアパターン処理)
- DS-3-10 音響電子透かしの検出強度を用いた位置推定(DS-3.マルチメディア情報ハイディング,シンポジウムセッション)
- プリファレンスを用いた信用交渉における公開クレデンシャルの低減化 (ワイドバンドシステム)
- プリファレンスを用いた信用交渉における公開クレデンシャルの低減化 (情報セキュリティ)
- プリファレンスを用いた信用交渉における公開クレデンシャルの低減化 (情報処理)
- A-7-8 匿名通信方式3-Mode Netにおける中継ノード数の低減化(A-7.情報セキュリティ,一般セッション)
- 多重暗号化と確率的動作選択に基づく双方向通信可能な匿名通信方式 : 3-Mode Net(情報セキュリティ基礎)
- D-12-46 プライバシー保護を考慮した3D屋内環境可視化システム(D-12. パターン認識・メディア理解,一般セッション)
- D-11-130 情報ハイディングを利用した可逆型プライバシー保護画像処理(D-11. 画像工学,一般セッション)
- A-7-10 顧客のサービス利用度を考慮した三者間の信用交渉(A-7. 情報セキュリティ,一般セッション)
- 参加者のインタラクションを可視化したマルチメディア議事録の作成(一般セッション2,三次元画像,多視点画像)
- 事例映像への適合度と知覚品質に基づくホームビデオ編集支援(一般,顔・人物・ジェスチャ・行動)
- 時空間の相互影響パターンを用いた群衆解析(テーマ関連,顔・人物・ジェスチャ・行動)
- 時空間の相互影響パターンを用いた群衆解析(テーマ関連,顔・人物・ジェスチャ・行動)
- Media Tray : ユーザが構成可能なカフェテリア型コンテンツ視聴環境(マルチメディア処理)
- テレビ視聴行動からの個人的選好獲得(一般セッション2,三次元画像,多視点画像)
- 個人的選好獲得のための特定人物のテレビ視聴時における興味区間推定(マルチメディア応用,画像の認識・理解論文)
- パターン認識・メディア理解のグランドチャレンジ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 事例に基づく映像ショット列への音楽付与(テーマセッション,クロスモーダル)
- 事例に基づく映像ショット列への音楽付与(テーマセッション,クロスモーダル)
- 事例に基づく映像ショット列への音楽付与(テーマセッション,クロスモーダル)
- 事例に基づく映像ショット列への音楽付与(テーマセッション,クロスモーダル)
- RK-006 固定カメラに対する周辺情報を考慮したズーム映像の生成(教育工学・福祉工学・マルチメディア応用,査読付き論文)
- 文書分類システムの分類誤りに着目した分類ルール修正法
- D-12-62 ランダムフォレストを利用した高次特徴の高速検出(D-12.パターン認識・メディア理解,一般セッション)
- PriSurv:プライバシー保護機能を有する映像サーベイランスシステム
- 公共空間における行動の階層性に基づく非正常行動検出(テーマ関連,顔・人物・ジェスチャ・行動)
- 公共空間における行動の階層性に基づく非正常行動検出(テーマ関連,顔・人物・ジェスチャ・行動)
- 状況依存モデルを用いた異常行動の検出(一般,膨大なデータから学ぶもの)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- 音声合成のための自動アクセントラベリング(セッション5 : 音声認識+音声合成)
- 事例映像への適合度と知覚品質に基づくホームビデオ編集支援(一般,顔・人物・ジェスチャ・行動)
- RK-007 事例映像に基づくシーンに対する適応的音楽選択(教育工学・福祉工学・マルチメディア応用,査読付き論文)
- 店舗内に設置した全方位視覚センサによる顧客の行動解析(一般セッション(1))
- Video surveillance system for community spaces (パターン認識・メディア理解)
- D-11-114 MPEGに対するメタデータの埋め込み(I) : 動きベクトルに着目した場合(D-11.画像工学D)
- D-11-109 MPEGに対するメタデータの埋め込み(II) : 静止画に着目した場合(D-11.画像工学D)
- メタデータを付与された映像メディアからの個人の趣味・嗜好の獲得(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- メタデータを付与された映像メディアからの個人の趣味・嗜好の獲得
- メタデータを付与された映像メディアからの個人の趣味・嗜好の獲得
- 事例に基づく映像ショット列に対する音楽ミキシング (パターン認識・メディア理解)
- 1.今なぜグランドチャレンジか(パターン認識・メディア理解のグランドチャレンジ)
- I-070 感性語と名詞の併用による画像検索の基礎考察(I分野:グラフィクス・画像,一般論文)
- プリファレンスを用いた信用交渉における公開クレデンシャルの低減化(一般:情報通信基礎サブソサイエティ合同研究会)
- プリファレンスを用いた信用交渉における公開クレデンシャルの低減化(一般:情報通信基礎サブソサイエティ合同研究会)
- プリファレンスを用いた信用交渉における公開クレデンシャルの低減化(一般:情報通信基礎サブソサイエティ合同研究会)
- グランドチャレンジ
- 疎分散カメラ間の人物グループの対応付けによる人流解析 (パターン認識・メディア理解)
- フィードバックをともなう映像シーンのクラスタリング(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- フィードバックをともなう映像シーンのクラスタリング
- フィードバックをともなう映像シーンのクラスタリング
- 不均衡データからのランダムフォレストを利用した高速高次特徴抽出
- 映像編集のための事例学習に基づく素材映像からのショット列生成(一般セッション2,三次元画像,多視点画像)
- 映像編集のための事例学習に基づく素材映像からのショット列生成(一般セッション2,三次元画像,多視点画像)
- 大規模施設におけるスケジューリングを伴う個人行動支援システムの提案
- K-046 映像特徴に基づく撮影者が意図した人物被写体の推定(教育工学・福祉工学・マルチメディア応用,一般論文)
- D-12-32 長方形近似とその補正に基づく屋内環境の三次元モデリング(D-12.パターン認識・メディア理解,一般セッション)
- ネットワークの定性的挙動解析
- J-031 可変幅量子化型DWT変換を用いた電子透かしによる改ざん種類推定(J分野:グラフィクス・画像)
- テレビ視聴環境における個人的選好獲得のための視聴区間推定(一般セッション(1), ユビキタスメディアの将来展望)
- テレビ視聴環境における個人的選好獲得のための視聴区間推定(一般セッション(1), ユビキタスメディアの将来展望)
- A-7-2 擬素数を用いたRSA暗号系に関する一考察(A-7.情報セキュリティ,基礎・境界)
- I-014 個人的選好獲得のための選択的人物同定によるテレビ視聴区間推定(I分野:画像認識・メディア理解)
- D-12-90 スライドショー生成のための事例に基づく画像選択(D-12.パターン認識・メディア理解,一般セッション)