ヒストグラム特徴を用いた音や映像の高速AND/OR探索
スポンサーリンク
概要
- 論文の詳細を見る
既知の音や映像(参照信号)が長時間の音や映像(入力信号)のどの時点にあるかを探索する問題を, 文字列探索と対比して時系列探索と呼ぶ.時系列探索では, 音と映像を組み合わせたり, 複数の探索条件を論理式で指定して, 高速に探索を行えることが望まれる.そこで本論文では, まず, 我々が前論文で提案した音響信号探索法である時系列アクティブ探索法を, 映像の探索にも適用できることを述べる.次に, 参照信号についてのAND探索及びOR探索の効率的なアルゴリズムを提案する.更に, 音と映像を組み合わせたマルチモーダルAND探索アルゴリズムを提案する.提案する各アルゴリズムは, それぞれ, 個別に探索を行った結果を組み合わせる場合に比べ高速である.例えば参照信号についてのOR探索では, 参照信号の相互類似度が0.8以上の場合に, 1個の参照信号を探索する場合の約1.2倍以下の探索時間で, 5個の参照信号を探索できることが示された.
- 社団法人電子情報通信学会の論文
- 2000-12-25
著者
-
柏野 邦夫
NTTコミュニケーション科学基礎研究所
-
黒住 隆行
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
村瀬 洋
Nttコミュニケーション科学基礎研究所
-
黒住 隆行
NTTコミュニケーション科学基礎研究所, 日本電信電話株式会社
-
黒住 隆行
NTTコミュニケーション科学基礎研究所
関連論文
- Twitterにおける実況書き込み検出手法の検討(映像コンテンツ,人工現実感)
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- 調理動作に注目したマルチメディア料理レシピの提案(萌芽(生活メディア)セッション,生活メディア)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- 色変動を考慮した生成型学習法による道路標識検出器の構築(パターン認識応用,画像の認識・理解論文)
- パラメトリック表現に基づく医用画像の高速位置あわせ
- 多様な属性に柔軟に対応できる人物属性認識の準教師付き学習フレームワーク(一般セッション,光と色の解析・表現とその応用)
- 画像認識とGPU
- 空撮画像と時系列車載カメラ画像との照合による自車位置推定(テーマセッション関連,一般物体認識・画像特徴量)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 2値多重音響特徴ベクトルを用いた類似音楽探索法の頑健性評価
- 一般物体認識のためのマルチモーダル星座モデル(パターン認識と学習,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 街並み画像系列と2台の車載カメラの画像系列との照合による自車の走行位置推定(テーマセッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
- 複数映像統合による車載カメラ映像からの移動物体除去(一般セッション,一般物体認識・画像特徴量)
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 放送映像における準同一映像区間の出現パターンによる分類(一般セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 放送映像における準同一映像区間の出現パターンによる分類(一般セッション4)
- 音響指紋技術とその応用
- 車載レーザスキャナによる距離データマップの構築と高精度自車位置推定(パターン認識)
- 時間・空間的にまばらな多視点画像を用いた個人識別のための動的な見え方学習法
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- ドライバの注視行動を利用した視線計測システムの自動校正(インタラクション・VR,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 一般物体認識のためのタイプの異なる局所特徴の統合利用(パターン認識)
- 多数の顔画像を用いて顔向きの変換を行うView hallucinationの提案(一般セッション,一般物体認識・画像特徴量)
- 車載カメラを用いた道路標識の視認性推定のための画像特徴の検討(テーマセッション関連,一般物体認識・画像特徴量)
- 料理レシピ中の初心者に理解困難な表現の抽出(生活メディアセッション,生活メディア)
- A-16-1 料理レシピにおける形容表現抽出手法の検討(A-16.マルチメディア・仮想環境基礎,一般セッション)
- A-16-2 画像特徴の時間変化に基づく料理映像の分類(A-16.マルチメディア・仮想環境基礎,一般セッション)
- D-12-90 2枚の顔画像から正面顔を推定する手法に関する検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- 適応的画像選択による輪郭からの物体形状計測
- 局所色情報を用いた高速物体探索 : アクティブ探索法
- アクティブ視点制御の効果と物体形状について
- メディアコンテンツ特定技術の最新動向
- 認識理解への認知発達的アプローチ (パターン認識・メディア理解)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- AS-5-5 複合ソースフィルタモデルによる音響信号の三要素テンソル分解(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- 実環境で収録された映像断片をキーとする一致映像探索(マルチメディア応用,画像の認識・理解論文)
- 高速メディア探索 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 音楽や映像の高速探索(工学と芸術を融合する若い息吹)
- ベイジアンネットワークの音響認識への応用
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集し,合成できるインタフェース
- Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
- 相平面に描かれるF0の動的変動成分を利用した歌唱様式の自動分類
- 映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 実環境で受音した楽音をキーとする楽曲探索法(パターン認識)
- グローバルな枝刈りを導入した音や映像の高速探索
- 同じ音や映像を高速に探す技術--学習アクティブ探索法 (特集論文1 高度検索技術)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- 携帯カメラで収録した映像をキーとする一致映像探索
- グローバルな枝刈りを導入した音や映像の高速探索
- LI-18 携帯電話で受音した音をキーとする音響信号探索(I. 画像認識・メディア理解)
- 区分線形写像に基づく音響信号の高速探索
- 区分線形写像に基づく映像信号の高速探索
- 解説 確率ディザボーティング--低品質な映像も瞬時に探すためのコア技術
- R&Dホットコーナー 楽曲やCMの高速検索を実現する学習アクティブ探索ライブラリ--NTTコミュニケーション科学基礎研究所
- 音や影像を素早く探すメディア探索技術の未来 (特集 人間情報科学が切り拓くコミュニケーションの未来)
- 時系列アクティブ探索法のための特徴ひずみに頑健な確率デイザボーテイング (画像の認識・理解論文特集)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 線形2次系を利用した歌声のF0ダイナミクスの統計的モデル化と分析(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- TRECVID 2010 Instance Searchタスク参加報告 (パターン認識・メディア理解)
- 相平面に描かれるF_0の動的変動成分を利用した歌唱様式の自動分類
- 多数の小領域スペクトログラムの探索に基づく背景音楽の高速探索法(音楽情報処理)
- 2値多重音響特徴ベクトルを用いた類似音楽探索とその高速化(マルチメディアパターン処理)
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- D-12-57 携帯電話で受音した音楽をキーとする高速音響信号探索
- グローバルな枝刈りを導入した長時間音響信号の探索 : 時系列アクティブ探索の高速化
- 時系列アクティブ探索法に基づく音や映像の高速AND/OR探索
- ヒストグラム特徴を用いた音や映像の高速AND/OR探索
- 多種類の特徴歪みを考慮した音響信号の高速探索法
- 多種類の特徴歪みを考慮した音響信号の高速探索法
- 二つの音響信号に共通に現れる部分信号区間の高速自動抽出
- ヒストグラム特徴を用いた音響信号の高速探索法 : 時系列アクティブ探索法
- 時系列アクティブ探索法における音響信号の高速AND/OR探索
- DT-3-1 長時間メディアの高速時系列探索(DT-3. 長時間メディア処理のためのパターン認識・メディア理解の基盤技術, 情報・システム2)
- 音楽を聞き分けるコンピュータ(「音楽情報処理研究への誘い特集号」)
- 適応的領域分割と初期しきい値推定によるテンプレートマッチングの高速化
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- TRECVID 2010 Content-Based Copy Detectionタスク参加報告(テーマセッション,映像処理とTRECVID)
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- 音楽や映像を特定するメディア指紋技術とその応用(インダストリアルマテリアルズ)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- モンドリアンHMMによる音楽信号の解析(テーマセッション,自然言語とパターン認識の境界)
- モンドリアンHMMによる音楽信号の解析(テーマセッション,自然言語とパターン認識の境界)
- 編集にあたって(聖徳太子をつくる技術)
- DPマッチング
- 画像をクエリとしたインスタンス映像検索(テーマセッション,大規模データベースとパターン認識)
- D-12-98 視体積交差法を用いた複数カメラからの人数推定に関する検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス))
- 複数カメラを用いた人数分布推定に関する検討(一般セッション,大規模データとパターン認識・メディア理解,地球をとらえる,CEATEC連携)
- Exponential BM25によるインスタンスサーチ(人体・動作の認識と理解,福祉と共生,国際会議報告)