特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
スポンサーリンク
概要
- 論文の詳細を見る
われわれは音や映像の探索の研究の一環として音響信号探索の研究を進めている.音響信号探索とは, ある音響信号の断片が, それとは別の長時間の音響信号のどの時点にあるかを探索する問題である.これまでに時系列アクティブ探索法な高速性に主眼をおいた手法を提案したが, 携帯電話で収録した音のように, 様々な歪みを含んだ信号を精度良く探索する手法については未検討であった.そこで本稿では, 携帯端末により実環境で収録した音に基づく音響信号探索を想定し, 精度良く探索する手法について検討する.本稿の基本的なアイデアは, 機器特性や環境雑音などによる歪みに対して頑健な部分空間を構成して照合を行うというものである.その際, 時間周波数空間上の局所領域ごとに正規化を行う.実環境においてマイクやPHSで収録した音響信号の断片が, CD品質の蓄積信号のどの曲のどの時刻に対応するかを調べる課題について実験を行ったところ, 単純なパワーによる正規化とスペクトル照合を用いた場合に28.3%であった探索精度が, 83.5%にまで改善された.
- 一般社団法人電子情報通信学会の論文
- 2001-07-11
著者
-
黒住 隆行
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
村瀬 洋
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
-
黒住 隆行
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
関連論文
- Twitterにおける実況書き込み検出手法の検討(映像コンテンツ,人工現実感)
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- 調理動作に注目したマルチメディア料理レシピの提案(萌芽(生活メディア)セッション,生活メディア)
- 色変動を考慮した生成型学習法による道路標識検出器の構築(パターン認識応用,画像の認識・理解論文)
- 画像認識とGPU
- 空撮画像と時系列車載カメラ画像との照合による自車位置推定(テーマセッション関連,一般物体認識・画像特徴量)
- 複数映像統合による車載カメラ映像からの移動物体除去(一般セッション,一般物体認識・画像特徴量)
- 多数の顔画像を用いて顔向きの変換を行うView hallucinationの提案(一般セッション,一般物体認識・画像特徴量)
- 車載カメラを用いた道路標識の視認性推定のための画像特徴の検討(テーマセッション関連,一般物体認識・画像特徴量)
- D-12-49 超解像を用いた低解像度QRコード画像認識の検討(D-12.パターン認識・メディア理解,一般セッション)
- D-12-39 顕著度を考慮した歩行者の視認性定量化手法の検討(D-12.パターン認識・メディア理解,一般セッション)
- 属性に基づく学習型人物検索(画像認識,コンピュータビジョン)
- メディアコンテンツ特定技術の最新動向
- 実環境で収録された映像断片をキーとする一致映像探索(マルチメディア応用,画像の認識・理解論文)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- GPS生データの蓄積による高精度自車位置推定手法の提案 : 移動体における基礎検討(ITSポジショニング,一般)
- 運転者支援のための交通信号機視認性数値化手法
- 拡張DPマッチングを用いた視野角の異なるカメラ映像間の時空間対応付けによる自車位置推定(画像認識,コンピュータビジョン)
- D-12-34 Wikipediaエントリを用いたニュース字幕中の人物の名寄せ(D-12.パターン認識・メディア理解,一般セッション)
- 口唇動作特徴と音声特徴の共起性に基づく被写体と話者の不一致検出(萌芽(2):マルチメディア,日常生活におけるメディア技術)
- 実用化に向けた顔画像処理技術(特別講演,顔・人物・ジェスチャ・行動)
- 実用化に向けた顔画像処理技術(特別講演,顔・人物・ジェスチャ・行動)
- 料理レシピをわかりやすくするための理解困難な表現の補足(料理・メディア,デジタルミュージアムとエンタテイメントメディア)
- フレーム選択型超解像処理を用いた低解像度文字認識手法の提案(一般,顔・人物・ジェスチャ・行動)
- フレーム選択型超解像処理を用いた低解像度文字認識手法の提案(一般,顔・人物・ジェスチャ・行動)
- ニュース映像間の時系列意味構造を利用したWikipedia記事のマルチメディア化(料理・メディア,デジタルミュージアムとエンタテイメントメディア)
- ジオタグ付き写真を用いた風景カテゴリマップ作成手法の検討(複合現実感,仮想都市)
- 2値パターン拘束と超解像を組み合わせた低解像度QRコード認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 2値パターン拘束と超解像を組み合わせた低解像度QRコード認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 画像特徴と音声特徴の統合利用による結婚式映像のシーン分類(萌芽(2):マルチメディア,日常生活におけるメディア技術)
- 複数の画像特徴の統合による道路標識の視認性推定手法 : 車載カメラ画像への適用と評価
- 複数の画像特徴の統合による道路標識の視認性推定手法 : 車載カメラ画像への適用と評価(交通センシング,交通センシング、通信、情報処理、一般)
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法(画像処理, 画像パターン認識)
- 歩行動作特性からの年齢層の推定
- ユーザとのコミュニケーションにおける擬人化エージェントの視線移動制御
- 劣化推定に基づいた辞書の自動選択による本棚画像中の文字認識
- テンプレート学習による本棚画像中の文字認識
- 複数情報が重畳した尺八譜認識に関する一検討
- 周囲文字を含んだ参照パターンによる本棚画像中の文字認識
- 辞書の自動選択による本棚画像中の文字認識
- 変形推定に基づいた参照パターンの自動選択による文字認識
- 複数情報が重畳した文字列認識の一検討 : 尺八譜認識の例
- 過去の車載カメラ映像との道路面差分による不特定障害物の検出(一般,顔・人物・ジェスチャ・行動)
- 注視対象の位置関係を利用した車載視線計測システム自動較正の高度化(テーマ関連,顔・人物・ジェスチャ・行動)
- 過去の車載カメラ映像との道路面差分による不特定障害物の検出(一般,顔・人物・ジェスチャ・行動)
- 注視対象の位置関係を利用した車載視線計測システム自動較正の高度化(テーマ関連,顔・人物・ジェスチャ・行動)
- D-12-72 動画像を用いた一般物体のカテゴリ識別に関する検討(D-12.パターン認識・メディア理解,一般セッション)
- D-12-20 HOG特徴を用いた映像中の人物の周期的動作検出に関する検討(D-12.パターン認識・メディア理解,一般セッション)
- 車載カメラ映像からの学習サンプルの自動収集による標識検出器の高精度化に関する検討(一般セッション,文字・文書の認識・理解)
- 背景差分法による物体検出を目的とした逐次モンテカルロ法による背景推定(画像・映像処理)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 実環境で受音した楽音をキーとする楽曲探索法(パターン認識)
- グローバルな枝刈りを導入した音や映像の高速探索
- 同じ音や映像を高速に探す技術--学習アクティブ探索法 (特集論文1 高度検索技術)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- 携帯カメラで収録した映像をキーとする一致映像探索
- グローバルな枝刈りを導入した音や映像の高速探索
- LI-18 携帯電話で受音した音をキーとする音響信号探索(I. 画像認識・メディア理解)
- 区分線形写像に基づく音響信号の高速探索
- 区分線形写像に基づく映像信号の高速探索
- 解説 確率ディザボーティング--低品質な映像も瞬時に探すためのコア技術
- R&Dホットコーナー 楽曲やCMの高速検索を実現する学習アクティブ探索ライブラリ--NTTコミュニケーション科学基礎研究所
- 音や影像を素早く探すメディア探索技術の未来 (特集 人間情報科学が切り拓くコミュニケーションの未来)
- 時系列アクティブ探索法のための特徴ひずみに頑健な確率デイザボーテイング (画像の認識・理解論文特集)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- Twitterにおける実況書き込み検出手法の検討(映像コンテンツ,人工現実感)
- 人物検出を目的とした照明変化に応じた背景画像の生成
- I-39 全方位カメラと複数のマイクロホンを用いた話者の検出(全方位画像解析・ロボットビジョン,I.画像認識・メディア理解)
- LI-4 擬人化エージェントのための小型円筒ディスプレイ(I. 画像認識・メディア理解)
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 擬人化エージェントのための小型円筒ディスプレイとその応用
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 動的アクティブ探索法と複数の能動カメラを用いた物体の位置推定
- 色ヒストグラム特徴とパン・チルト・ズームカメラを用いた高速物体探索法 : 動的アクティブ探索法 (画像の認識・理解論文特集)
- 6ZN-1 調理動作に注目した料理レシピのマルチメディア化の提案(情報爆発時代におけるマルチメディア処理,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- タブレット入力による手書き文字・図型認識
- 多数の小領域スペクトログラムの探索に基づく背景音楽の高速探索法(音楽情報処理)
- 2値多重音響特徴ベクトルを用いた類似音楽探索とその高速化(マルチメディアパターン処理)
- C-016 ベイズ情報量規準に基づくK-Meansクラスタリングのためのアーキテクチャ(C分野:ハードウェア・アーキテクチャ,一般論文)
- 6ZN-4 ニュース映像間の意味構造を利用したWikipedia情報の拡張(情報爆発時代におけるマルチメディア処理,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 2010年度PRMUアルゴリズムコンテスト「ターゲットをロックオンせよ!--移動物体の追跡」--実施報告と受賞アルゴリズム紹介 (パターン認識・メディア理解)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- D-12-57 携帯電話で受音した音楽をキーとする高速音響信号探索
- グローバルな枝刈りを導入した長時間音響信号の探索 : 時系列アクティブ探索の高速化
- 時系列アクティブ探索法に基づく音や映像の高速AND/OR探索
- ヒストグラム特徴を用いた音や映像の高速AND/OR探索
- 多種類の特徴歪みを考慮した音響信号の高速探索法
- 多種類の特徴歪みを考慮した音響信号の高速探索法
- 二つの音響信号に共通に現れる部分信号区間の高速自動抽出
- 多数の小区間信号の探索に基づく背景音楽の探索
- 多数の小区間信号の探索に基づく背景音楽の探索
- D-12-22 メディア探索のための曖昧文字列照合の高速計算法
- TRECVID 2010 Content-Based Copy Detectionタスク参加報告(テーマセッション,映像処理とTRECVID)
- 音楽や映像を特定するメディア指紋技術とその応用(インダストリアルマテリアルズ)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 複数カメラを用いた人数分布推定に関する検討(一般セッション,大規模データとパターン認識・メディア理解,地球をとらえる,CEATEC連携)