Python/Vk : 映像ハンドリング研究のためのプロトタイピング環境
スポンサーリンク
概要
- 論文の詳細を見る
映像の内容把握を支援する映像ハンドリング研究を効率よく進めるために,スクリプト言語Pythonから,カット点やカメラワーク検出などの技術を容易に扱えるようにするPython/Vkというプログラミング環境を構築した.Python/Vkを用いると,映像ファイルからフレーム画像や音声データを取り出して,映像の構造化や検索のためのインデクス付け,要約などの加工を容易に実装することができる.また,OSSのコンピュータビジョンライブラリOpenCVや,数値演算ライブラリNumPy, SciPyと組み合わせることで,より高度な映像認識処理を実現することができる.本稿では,Python/Vkのアーキテクチャや,C++と比べた生産性評価,アプリケーションの例を示す.
- 2012-08-30
著者
-
佐藤 隆
NTTサイバーソリューション研究所
-
東野 豪
日本電信電話株式会社, NTTサイバーソリューション研究所
-
佐藤 隆
日本電信電話株式会社 サイバーソリューション研究所
-
佐藤 隆
Ntt サイバーソリューション研
-
吉田 大我
日本電信電話株式会社NTTサイバーソリューション研究所
-
後藤 充裕
日本電信電話株式会社NTTサイバーソリューション研究所
-
東野 豪
日本電信電話株式会社サービスエボリューション研究所
-
後藤 充裕
日本電信電話株式会社サービスエボリューション研究所
-
吉田 大我
日本電信電話株式会社サービスエボリューション研究所
-
佐藤 隆
日本電信電話株式会社サービスエボリューション研究所
-
東野 豪
日本電信電話株式会社 サービスエボリューション研究所
-
後藤 充裕
日本電信電話株式会社 サービスエボリューション研究所
-
吉田 大我
日本電信電話株式会社 NTTサイバーソリューション研究所
-
東野 豪
日本電信電話株式会社 NTTサイバーソリューション研究所
-
佐藤 隆
日本電信電話株式会社 NTTサービスエボリューション研究所
関連論文
- みんな集まれバッジによる対話機会創出の検討(セッションコミュニケーション支援)
- 画面遷移における遅延の許容範囲と遷移方法(五感メディアの品質,仮想空間におけるコミュニケーションデザイン,一般)
- 個人撮影映像を対象とした映像速覧のための"笑い"シーン検出法(ディジタルコンテンツ制作-DCS'07関連-)
- 映像ダイジェスト配信システム「チョコパラTV」(ディジタルコンテンツ制作を支える新技術)
- んとと君 : マウス操作と音声で感情的な対話を行う仮想生物
- Flashを用いた3D顔画像合成によるコミュニケーションシステムの構築
- メディア工学
- C-Blink : 携帯端末カラーディスプレイによる色相差光信号マーカ(ヒューマンコンピュータインタラクション)
- 紙面上の仮想空間を用いた"Dipping"インタフェースの研究(実世界インタフェース)(仮想環境の応用事例集)
- SceneCabinet:映像解析技術を統合した映像インデクシングシステム
- D-4-5 検索と分類とを統合した映像検索
- 人に優しく、魅力的な新しいブラウザ・インタフェース (特集 情報流通プラットフォームが拓く21世紀のネットワーク化社会(2))
- 映像コンテンツの構造化・検索技術 (特集 情報流通プラットフォームが拓く21世紀のネットワーク化社会(2))
- 映像コーパスの構築と分析 (知能情報メディア論文特集)
- 消費者生成映像検索のための編集度順序推定法(一般セッション4,移動カメラ画像処理におけるパターン認識とメディア理解)
- 非同期コミュニケーションを促進する微笑み通信メディアの評価
- 構造化撮影テンプレートを用いた個人映像制作支援システム
- 構造化撮影テンプレートを用いた個人映像制作支援システム(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 構造化撮影テンプレートを用いた個人映像制作支援システム(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 構造化撮影テンプレートを用いた個人映像制作支援システム(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- M-054 infoMirror : 携帯電話と連携する鏡型情報アプライアンス(M.ネットワーク・モバイルコンピューティング)
- D-12-112 C-Blink : 携帯端末による空間指向情報インタラクションを実現する色相差光信号マーカー(D-12. パターン認識・メディア理解B)
- D-17-20 インタラクティブコンテンツ操作情報のリアルタイム収集方式
- A-16-28 コンテンツ配信システムにおける接続先決定の一手法
- A-16-27 クロスメディア連携システムのデザイン
- ハイパーインタラクティブサービスシステム : システムおよび「インタラクティブ・シネマ」試行サービス実験概要(放送,インタネット,モバイルマルチメディアおよび一般)
- 統計解析ソフト「R」
- D-12-94 CGM動画を対象とした感情表出区間自動検出法(D-12.パターン認識・メディア理解,一般講演)
- MPEG符号化映像からの高速テロップ領域検出法(動画像処理論文特集)
- MPEG符号化映像ショットチェンジ検出のための動き補償解析ハイブリッド法の提案(動画像処理論文特集)
- 2) MPEG符号化映像データからのシーンチェンジ検出方法の検討 (ネットワーク映像メディア研究会)
- MPEG符号化映像データからのシーンチェンジ検出方法の検討
- MPEG符号化映像データからのシーンチェンジ検出方法の検討
- MPEG符号化映像データからのシーンチェンジ検出方法の検討
- MPEG符号化映像データからのシーンチェンジ検出方法の検討
- D-041 適合性と具体性を考慮したキーワードのランキング(D分野:データベース,一般論文)
- 映像の速覧技術
- 映像配信のインタフェース
- Coaster : 映像の時空間直観的操作による可変速再生方法とその応用 (ヒューマンインタフェースとインタラクション)
- MPEG符号化映像からテロップ領域を高速に検出する方法--MPEGデータを直接解析して高速にテロップを検出
- Coaster : 映像の連続的ダイレクトマニピュレーション
- Coaster : 折れ線スライダによる時空間メディアインタフェース
- 映像コーパスの分析に基づく大量映像ハンドリング
- 映像コーパスの分析に基づく大量映像ハンドリング
- コンテンツ流通(制作・検索・ブラウザ)のインタフェース
- A-15-33 情報を降らせるインタフェース(A-15. ヒューマン情報処理, 基礎・境界)
- 映像利用のための表現と操作の機能インタフェースモデル(画像・映像処理)
- コンテンツとヒューマンインタラクション(人とコンテンツ) : (2)映像配信のインタフェース
- 映像を便利に扱いやすくする技術
- 遠隔会議における発話の衝突と精神的ストレスの関係
- インタラクティブメディア・インタフェース
- 並列分散による映像イベント検出の高速化
- 聴覚障がい者と聴者の団らん視聴を支援する映像視聴インタフェースに関する研究(視覚障害支援システム(2),聴覚障害及び一般)
- 遠隔会議における発話衝突低減手法
- 文字の切り出しを行わないテロップ文字列の高速な認識(テーマセッション,実世界文字認識と理解)
- Python/Vk : 映像ハンドリング研究のためのプロトタイピング環境 (映像表現&コンピュータグラフィックス)
- Python/Vk : 映像ハンドリング研究のためのプロトタイピング環境
- 発話がぶつからないWeb会議を実現するための発話欲求伝達手法
- Python/Vk : 映像ハンドリング研究のためのプロトタイピング環境
- 学習支援や授業ふり返りのための板書レクチャーの簡易コンテンツ化(映像(2),五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 学習支援や授業ふり返りのための板書レクチャーの簡易コンテンツ化(映像(2),五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 映像コンテンツ推薦システムのフィールド実験による主観評価(推薦システム,グループウェアとネットワーク,ライフログ活用技術,オフィス情報システム,セキュリティ心理学とトラスト,一般)
- 複数アルゴリズムの評価検討を踏まえた映像コンテンツ推薦システムの設計と実装(推薦システム,グループウェアとネットワーク,ライフログ活用技術,オフィス情報システム,セキュリティ心理学とトラスト,一般)
- 音声遅延が遠隔会議中の発話衝突と精神的ストレスに与える影響(ヒューマンコミュニケーション基礎,ヒューマンコミュニケーション〜人にやさしい情報通信社会を実現するコミュニケーション技術〜論文)
- 文字の切り出しを行わないテロップ文字列の高速な認識
- I-035 検出精度を維持した並列分散によるテロップ検出(オーディオビジュアル情報処理,I分野:グラフィクス・画像)
- RD-001 タグランキングに基づく映像推薦(情報・映像推薦,D分野:データベース)
- D-003 メタデータと映像特徴に基づく内容ベース映像推薦(Web,D分野:データベース)
- 3-2. メディア工学(3. メディア情報,映像情報メディア年報〜2008年4月から2010年3月の進展〜)
- 第29回 統計解析ソフト「R」(私の研究開発ツール,てれびさろん)
- モバイルアプリのファセット検索を実現するインデクシング手法(スマートフォン,モバイルアドホックネットワーク,モバイル時代を支える次世代無線技術,フィールドセンシング及び一般)
- モバイルアプリのファセット検索を実現するインデクシング手法(スマートフォン,モバイルアドホックネットワーク,モバイル時代を支える次世代無線技術,フィールドセンシング及び一般)
- Python/Vk : 映像ハンドリング研究のためのプロトタイピング環境
- D-019 POI情報を利用したWeb文書からの地名の抽出(D分野:データベース)
- 映像コンテンツ推薦システムのフィールド実験による主観評価
- 複数アルゴリズムの評価検討を踏まえた映像コンテンツ推薦システムの設計と実装
- 音声遅延が遠隔会議中の発話衝突と精神的ストレスに与える影響