漫画を対象としたインタラクティブセグメンテーション

概要

論文の詳細を見る
本研究では,漫画に対する検索などの応用処理の基盤として,漫画のコマにおいて,ユーザの入力に基づいたセグメンテーションを行うことを目的とする.そのために,ラスタ画像とベクタ画像の変換を可能にする可逆細線化と,Smart Scribbles の計算コストを抑えて遅延のない選択を実現する二段階のラベリングを提案する.ユーザによる評価から,従来漫画処理で用いられることの多い Adobe Photoshop のクイック選択ツールと比較して,F 値が平均 0.12 向上することを確認した.
2014-08-25

著者

山崎俊彦
東京大学大学院情報理工学系研究科電子情報学専攻
松井勇佑
東京大学大学院大学院情報学環
山崎俊彦
東京大学大学院学際情報学府
相澤清晴
東京大学大学院
松井勇佑
東京大学大学院情報理工学系研究科電子情報学専攻
荒巻祐治
東京大学大学院学際情報学府学際情報学専攻
相澤清晴
東京大学大学院学際情報学府学際情報学専攻|東京大学大学院情報理工学系研究科電子情報学専攻

関連論文

シルエット抽出とモデル生成の相互フィードバックによるTime-Varying Meshの高精度化(3次元再構成・多視点画像処理,画像の認識・理解論文)
4.食べる(生活に役立つメディア処理-料理行動を科学する-)
Wi-Fi位置推定と映像のパーティクルフィルタによる広域人物追跡(ネット,ゲーム等,仮想空間における映像メディアの処理,表現,応用,及び一般)
極座標表現を用いた形状特徴ベクトルによる3次元ビデオのセグメンテーション(メディアを観る, 画像の認識・理解)
D-12-83 簡易スタジオでの背景処理にロバストなTime-Varying Mesh生成(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
モバイル端末でのTime-Varying Mesh表示のためのメッシュ処理(立体映像技術一般)
2次元動画像をクエリとするTime-Varying Meshの検索(センサネットワーク,Webにおける映像メディア処理,応用及び一般)
D-12-76 Time-Varying Meshの位相変化検出と編集(D-12. パターン認識・メディア理解,一般セッション)
D-11-108 時間変化を考慮したランレングスを用いたTime-Varying Meshの幾何情報(D-11. 画像工学,一般セッション)
D-11-107 Time Varying Meshesの階層的な分割と動き追跡(D-11. 画像工学,一般セッション)
D-11-106 スケルトンを用いた動き抽出によるTime-Varying Meshのモデルベース符号化(D-11. 画像工学,一般セッション)
モデルに基づくTime-Varying Meshの分析と合成(ITS画像処理,映像メディア及び一般)
Time-Varying Meshの編集 : 動きの分解と再合成(ディジタルコンテンツ制作-DCS'07関連-)
非線形画像幾何変換攻撃に対応したオブジェクトベース電子透かしとWEBサービス展開(センサネットワーク,Webにおける映像メディア処理,応用及び一般)
40分で書くHoG(First Person Visionのための認識・理解)
3.料理メディア : 台所におけるディジタルコンテンツの処理と利用(ディジタルコンテンツ制作の最新動向〜ここまで来たディジタルコンテンツ制作〜)
食事ログの取得と処理 : 画像処理による食事記録
食事画像の解析における特徴量選択の評価(ITS画像処理,映像メディア及び一般)
食事画像の解析における特徴量選択の評価(画像処理,ITS画像処理,映像メディア及び一般)
D-12-42 食事ログ取得と処理(D-12. パターン認識・メディア理解,一般セッション)
V-IおよびI-V変換回路を搭載した低消費電力スイッチトカレントCDMAマッチトフィルタ(VLSI回路,デバイス技術(高速,低電圧,低電力))
フローティングゲートMOS CDMAマッチトフィルタにおける擬似並列マルチパス検出アーキテクチャ(VLSI回路,デバイス技術(高速,低電圧,低電力))
V-IおよびI-V変換回路を搭載した低消費電力スイッチトカレントCDMAマッチトフィルタ(VLSI回路,デバイス技術(高速,低電圧,低電力))
フローティングゲートMOS CDMAマッチトフィルタにおける擬似並列マルチパス検出アーキテクチャ(VLSI回路,デバイス技術(高速,低電圧,低電力))
D-12-17 多視点固定カメラ映像による日常生活データにおけるイベント検出(D-12. パターン認識・メディア理解, 情報・システム2)
自針と分針 : 映像からの人物抽出によるメディアアート(メディアアート,デジタルミュージアムとエンタテイメントメディア)
40分で書くHoG(First Person Visionのための認識・理解)
40分で書くHoG(First Person Visionのための認識・理解)
The Shadow Man : 影を用いたインタラクティブ・メディア・アート(メディアアート,デジタルミュージアムとエンタテイメントメディア)
モバイルやロボットに入り込む最先端画像処理 : ハードウェア化による高速化・低消費電力化の試み(Digital Harmonyを支えるプロセッサとDSP,画像処理の最先端)
B-15-10 スケルトンを利用した異なるモデル間でのメッシュ変形(B-15.モバイルマルチメディア通信,一般セッション)
I-079 3次元ブロックのRun-length CodingによるTime-Varying Meshの圧縮(I分野:グラフィクス・画像)
拡張ブロックマッチングアルゴリズムを用いた3次元映像の圧縮
D-11-24 動き補償とDCTを用いた3次元ビデオの圧縮(D-11.画像工学A(画像基礎・符号化),一般講演)
J-013 3次元拡張ブロックマッチングによる残差データの解析(J分野:グラフィクス・画像)
拡張ブロックマッチングによる3次元ビデオの圧縮に関する検討(映像・マルチメディア処理及び一般)
拡張ブロックマッチングによる3次元ビデオの圧縮に関する検討(映像・マルチメディア処理及び一般)
3X-7 スケルトンを用いた異なるメッシュモデル間の対応点抽出(3次元画像処理・認識,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
モバイルやロボットに入り込む最先端画像処理 : ハードウェア化による高速化・低消費電力化の試み(Digital Harmonyを支えるプロセッサとDSP,画像処理の最先端)
モバイルやロボットに入り込む最先端画像処理 : ハードウェア化による高速化・低消費電力化の試み(Digital Harmonyを支えるプロセッサとDSP,画像処理の最先端)
D-11-35 DPマッチングの経路制限による2次元動画をクエリとしたTVM検索の精度向上(D-11.画像工学,一般セッション)
I-043 2D動画クエリによるTVM検索のための特徴量の検討(グラフィクス・画像,一般論文)
2次元動画像をクエリとするTime-Varying Meshの検索(センサネットワーク,Webにおける映像メディア処理,応用及び一般)
無線LANマルチカメラサーベイランスシステムにおける映像伝送 : 画像サイズの動的変更とマルチカメラへの帯域割当(研究速報,符号化システム,画像符号化・映像メディア処理)
D-11-80 無線LANベースのマルチカメラサーベイランスシステムにおけるビットレート制御のための評価尺度の検討(D-11.画像工学D(画像処理・計測),一般講演)
無線LANベースのマルチカメラサーベイランスシステムにおける階層的帯域割り当てによる映像伝送
無線LANベースのマルチカメラサーベイランスシステムにおける階層的帯域割り当てによる映像伝送
無線LANベースのマルチカメラサーベイランスシステムにおける階層的帯域割り当てによる映像伝送(映像伝送・符号化,オフィスにおけるマルチメディア通信,IP放送/映像サービスの品質及び一般)
無線LANベースのマルチカメラサーベイランスシステムにおける階層的帯域割り当てによる映像伝送(映像伝送・符号化,オフィスにおけるマルチメディア通信,IP放送/映像サービスの品質及び一般)
無線LANベースのマルチカメラサーベイランスシステムにおける階層的帯域割り当てによる映像伝送(映像伝送・符号化,オフィスにおけるマルチメディア通信,IP放送/映像サービスの品質及び一般)
6Z-1 食事画像における類似画像検索(インタラクティブシステム,学生セッション,ネットワーク,情報処理学会創立50周年記念)
5G-4 ペン入力による動的な軌跡の描画に関するユーザビリティ評価(ユーザインタフェース,一般セッション,インタフェース,情報処理学会創立50周年記念)
D-9-13 食事ログシステムの利用状況調査(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
食事画像の解析における特徴量選択の評価(画像処理,ITS画像処理,映像メディア及び一般)
2Y-8 食事ログに向けた画像処理による料理の味推定(物体認識,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
I-010 Video2Manga : A Comic-like Video Summary
2ZD-5 全方位カメラによる参照画像を用いた屋内における位置推定 : デジタルミュージアムでの鑑賞者の行動記録に向けて(位置・コンテキスト推定(2),学生セッション,ネットワーク,情報処理学会創立50周年記念)
全方位カメラによる位置参照画像群を用いた屋内位置推定 : デジタルミュージアムでの鑑賞者の行動記録に向けて(デジタルミュージアム,デジタルミュージアムとエンタテイメントメディア)
H-060 広域サーベイランス映像の時空間解析手法の検討(H分野:画像認識・メディア理解)
3Y-8 コメント解析によるCGM動画のシーン処理(線画像・画像検索・映像処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
D-12-120 加速度センサによるクエリを用いたモーションキャプチャデータの検索(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
O-012 写真による対人ログデータからの親密度推定(O分野:情報システム,一般論文)
H-034 公共空間における多人数追跡と属性解析(H分野:画像認識・メディア理解,一般論文)
H-025 食事ログシステムの解析の個人への適応と検討(H分野:画像認識・メディア理解,一般論文)
H-022 写実的レンダリングに向けたTime-Varying Meshの表面属性推定(H分野:画像認識・メディア理解,一般論文)
1ZB-1 汎用ライフログデータ取得のための携帯端末の開発(ユビキタスデータ管理,学生セッション,ネットワーク,情報処理学会創立50周年記念)
2Y-7 Histogram of Oriented Gradientsアルゴリズムのハードウェア実装に向けた検討(物体認識,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
D-12-18 映像とWi-Fi位置推定を統合した広域追跡による追視システム(D-12. パターン認識・メディア理解,一般セッション)
Wi-Fi位置推定と映像のパーティクルフィルタによる広域人物追跡(ネット,ゲーム等,仮想空間における映像メディアの処理,表現,応用,及び一般)
D-12-6 Wi-Fi位置推定を併用する分散カメラ環境下での人物追跡(D-12.パターン認識・メディア理解,一般講演)
D-11-54 SIFT特徴量を用いたオブジェクトベース電子透かし(D-11.画像工学D(画像処理・計測),一般講演)
SIFT特徴量を用いた幾何学的不変のオブジェクトベース電子透かし
SIFT特徴量を用いた幾何学的不変のオブジェクトベース電子透かし(画像符号化・通信・ストリーム技術,及び一般)
SIFT特徴量を用いた幾何学的不変のオブジェクトベース電子透かし(画像符号化・通信・ストリーム技術,及び一般)
SIFT特徴量を用いた幾何学的不変のオブジェクトベース電子透かし
I-040 ポリゴン頂点の主成分分析による3Dビデオの動き特徴量抽出とシーン分割(I分野:画像認識・メディア理解)
見た目に基づくWebページ検索のための視覚的類似度尺度(ディジタルコンテンツ制作-DCS'07関連-)
D-9-7 全方位カメラ画像を用いた博物館における展示物認識(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
H-004 ウェアラブルカメラを利用した展示会場での見学履歴取得(画像認識・メディア理解,一般論文)
D-11-120 前方と側方カメラによる車載映像とGPSを用いた同一地点画像検索の精度に関する検討(D-11.画像工学D(画像処理・計測),一般講演)
I-056 前方/側方カメラを用いた車載映像の取得とその処理(I分野:画像認識・メディア理解)
センサデータのサンプリングによるライフログ映像の効率的要約(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
センサデータのサンプリングによるライフログ映像の効率的要約
D-12-105 時空間サンプリングによるライフログデータの要約(D-12. パターン認識・メディア理解, 情報・システム2)
K-059 ユーザ体験の時空間サンプリングによるライフログ映像のキーフレームの抽出(K.ヒューマンコミュニケーション&インタラクション)
A-16-25 ウェアラブルカメラとユビキタスカメラを同時利用したビデオ検索(A-16.マルチメディア・仮想環境基礎,一般講演)
D-12-5 コメント数の動的な変化を利用したCGM動画要約(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
D-12-21 個人的なビデオのための会話の検出(D-12. パターン認識・メディア理解, 情報・システム2)
D-12-27 動き情報を用いた多視点画像から3D形状復元手法(D-12.パターン認識・メディア理解,一般セッション)
A-16-8 衣服ログ : イベントとの連携によるコーディネート支援を目指して(A-16.マルチメディア・仮想環境基礎,一般セッション)
D-12-28 信頼度に基づいた重み付きバンドル調整によるワイドベースライン画像の高精度デプスマップ推定(D-12.パターン認識・メディア理解,一般セッション)
D-12-55 テクスチャ解析による食事画像の領域分割(D-12.パターン認識・メディア理解,一般セッション)
D-12-54 食事ログにおける各個人の食事時刻と食傾向を利用した食事バランス推定(D-12.パターン認識・メディア理解,一般セッション)
D-12-82 単眼動画像を用いた大きな姿勢変化を伴う運動の種別判定(D-12.パターン認識・メディア理解,一般セッション)
D-12-4 二値線画である漫画画像のリターゲティング(D-12.パターン認識・メディア理解,一般セッション)
D-12-60 天井カメラ映像による公共空間での複数人物追跡と属性解析(D-12.パターン認識・メディア理解,一般セッション)
D-12-24 履歴を考慮した画像に基づく博物館内の鑑賞者の位置同定(D-12.パターン認識・メディア理解,一般セッション)
A-16-10 博物館来訪者が撮影した写真に基づく経路推定(A-16.マルチメディア・仮想環境基礎,一般セッション)
I-048 実体型匿名IDに関する検討(I分野:画像認識・メディア理解)
A-16-9 位置履歴を用いた屋内写真からの施設同定(A-16.マルチメディア・仮想環境基礎,一般セッション)

漫画を対象としたインタラクティブセグメンテーション

スポンサーリンク

概要

著者

関連論文

スポンサーリンク