重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
スポンサーリンク
概要
- 論文の詳細を見る
類似画像検索に関する新しい手法について報告する.スケール変化や視点移動などに伴う画像の幾何学変動や, 前景や背景の変化に伴う画像周辺領域の変動などに対応するためには, 画像中の部分領域での照合結果を統合することにより画像間の類似性を判断する方法が有効である.これまでに, 幾何学変動に対処するための特徴点抽出や, 周辺領域の変動に対処するための注目領域抽出を用いた手法が数多く提案されている.本報告では, 特徴点の重要度を表現するために, 注目領域抽出に利用されていた注目度を用いた, 新しい類似画像検索方法の枠組を提案する.すなわち, 特徴点周辺の注目度によって特徴点の重み付けを行い, 重み付き類似度により画像間の類似性を判定する.しかし, 重み付き類似度を従来のインデキシング手法に適用することが困難である.本報告では, 上記枠組における新しいインデックス構築・検索手法として, 重要度に基づくインデックスと重みなし類似度に基づくインデックスとを段階的に構築し, これらを用いてインデックス検索を行う, 2段階インデックス検索を提案する.提案の方法を用いることにより, 重み付き類似値がある閾値以上となる特徴を漏れなく高速に検出することが可能となる.
- 社団法人電子情報通信学会の論文
- 2005-06-09
著者
-
大塚 和弘
日本電信電話株式会社コミュニケーション科学基礎研究所
-
木村 昭悟
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
柏野 邦夫
NTTコミュニケーション科学基礎研究所
-
木村 昭悟
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
大塚 和弘
NTTサイバーソリューション研究所
-
大塚 和弘
NTTヒューマンインタフェース研究所
-
柏野 邦夫
日本電信電話(株)基礎研究所 情報科学研究部
-
川西 隆仁
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所:(現)(株)ぷららネットワークス
-
川西 隆仁
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
川西 隆仁
株式会社ぷららネットワークサービス企画部
-
大塚 和弘
横浜国立大学工学部電子情報工学科
-
柏野 邦夫
Ntt コミュニケーション科学基礎研
-
大塚 和弘
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話(株)NTTコミュニケーション科学基礎研究所
関連論文
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- メモリベースパーティクルフィルタ : 状態履歴に基づく事前分布予測を用いた頑健な対象追跡(画像映像解析,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 2値多重音響特徴ベクトルを用いた類似音楽探索法の頑健性評価
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 音響指紋技術とその応用
- 頭部姿勢の変動に頑健な表情認識技術--表情から人の気持ちを読み取ることを目指して
- パーティクルフィルタとこう配法の組合せによる頭部姿勢と表情の同時推定(メディア処理,画像の認識・理解論文)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 複数人会話における非言語インタラクション構造の推定--誰が誰にどのように反応しているか?
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3)
- 適応型混合テンプレートを用いた音源同定 : 音楽演奏への適用
- 認識理解への認知発達的アプローチ (パターン認識・メディア理解)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 高速メディア探索 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- CVPR2009報告 (パターン認識・メディア理解)
- 映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 複数人物の対面会話を対象としたマルコフ切替えモデルに基づく会話構造の確率的推論(ヒューマンインタフェース基礎)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- グローバルな枝刈りを導入した音や映像の高速探索
- 区分線形写像に基づく音響信号の高速探索
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- CVPR2009報告
- パーティクルフィルタとMCMC : そのコミュニケーション科学への応用(若手研究者のための講演会)
- 会話シーン分析のための音声映像技術 (特集 コミュニケーション科学の融合研究における新潮流)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 変動輝度テンプレートによる頭部姿勢と表情の同時推定
- ICMI 2007参加報告
- コミュニケーションを理解する音声・映像技術 (特集 我が国基礎・基盤研究の現状--NTTコミュニケーション科学基礎研究所)
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- LH-003 変動輝度テンプレートを用いた頭部姿勢変動に頑健な確率的表情認識手法(画像認識・メディア理解)
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- インデックス検索の情報理論的解析
- 非言語行動の観測に基づく複数人物の会話シーン分析 招待講演
- 姿勢とアピアランスの変化に頑健な対象追跡を実現するアピアランス統合メモリベースパーティクルフィルタ (画像の認識・理解論文特集)
- 対面の複数人対話を撮影対象とした対話参加者の視線に基づく映像切替え方法とその効果(グループウェア)
- 複数人対話シーンの映像編集のための対話参加者の視線に基づく映像切り替え方法とその効果(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- A-14-6 対話参加者の視線に基づく映像切り替え方法とその効果(A-14. ヒューマンコミュニケーション基礎)
- 視線の機能に着目した映像切り替え規則とその効果 : 人に分かりやすい映像生成を目指して(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- A-15-9 視線情報に基づく映像切り替え規則とその評価
- TRECVID 2010 Instance Searchタスク参加報告(テーマセッション,映像処理とTRECVID)
- 対話型映像認識理解における動的学習戦略に関する取り組み(テーマセッション,PRMUのフロンティア・グランドチャレンジ)
- 姿勢とアピアランスの変化に頑健な対象追跡を実現するアピアランス統合メモリベースパーティクルフィルタ(画像・映像解析,第13回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 手話会話における修復組織の分析(一般,『コミュニケーションの身体を捉える』及び一般)
- 半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索(一般セッション,PRMUのフロンティア・グランドチャレンジ)
- 複数人対話を対象とした表情と視線に基づく共感/反感の推定モデルとその評価--対話者間に生まれる感情をいかに理解するか? (ヒューマンコミュニケーション基礎)
- 多視点観測に基づく複数物体の相互オクルージョン解析と逐次状態推定
- 多視点観測に基づく複数物体の相互オクルージョン解析と逐次状態推定
- 複数人対話を対象とした表情と視線に基づく共感/反感の推定モデルとその評価 : 対話者間に生まれる感情をいかに理解するか?(顔とコミュニケーション)
- 招待講演 複数人会話シーン分析の研究と今後の展望 (音声)
- 動くディスプレイで会話が伝わる (特集 情報と人間を結ぶコミュニケーション科学)
- ビデオ通信環境における対人印象に関する探索的研究 : 当事者評価と傍観者評価の比較(コミュニケーションの心理及び一般)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション(実世界センシングとその応用)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション(実世界センシングとその応用)
- 手話会話における表現モダリティの継続性(相互作用のマルチモーダル分析)
- ビデオ通信環境における対人印象の規定因に関する探索的実験研究 : 第三者に対する映像呈示と音声呈示の比較(コミュニケーション(技術),「身体,あそび,コミュニケーション」及びコミュニケーション一般)
- 人間の視覚的注意の計算モデル(サーベイセッション,人の視聴覚情報処理とPRMUの接点)
- MM-Space:頭部運動の物理的補強表現に基づく会話場再構成
- 非負制約下における複合行列分解
- 人間の視覚的注意の計算モデル(サーベイセッション,人の視聴覚情報処理とPRMUの接点)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 複数人会話シーン分析の研究と今後の展望(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)
- 画像検索でのユーザ行動を利用した大規模画像アノテーション(一般物体認識,文字・文書,映像,医用画像,画像の認識・理解論文)
- sNMF:非負値制約下における複数行列の同時分解法 : ソーシャルメディア解析を応用例として(第15回情報論的学習理論ワークショップ)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション
- ACM Multimedia 2013参加報告と関連研究動向
- 関係データ解析のための長方形分割過程 (情報論的学習理論と機械学習)
- 大規模マルチメディア解析コーパスとしてのsocial curationの可能性(特別講演,大規模データベースとパターン認識)
- 非負制約下における複合行列分解とそのソーシャルメディア解析への応用
- 画像検索でのユーザ行動解析に基づく大規模画像アノテーション
- 視線一致範囲測定に関する探索的検討 : 疎らな実験データの解析(『場のデザイン』及びコミュニケーション一般)
- アイコンタクト知覚範囲の性差に関する探索的検討 : 社交性不安およびアイコンタクト相手の性別の影響(顔、表情の認知・理解,コミュニケーションの心理及び一般)
- SNSを利用したトピックモデルによる画像へのユーザ嗜好性の解析(テーマセッション,大規模データベースとパターン認識)
- 人間の視覚的注意の計算モデル
- 人間の視覚的注意の計算モデル