半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索(一般セッション,PRMUのフロンティア・グランドチャレンジ)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では音響信号自動タグ付け・検索問題に対し,半教師付き正準密度推定法SSCDE(Semi-supervised canonical density estimation)の適用を試みる.SSCDEは正準相関分析にタグ無しサンプルの大域的分布構造を組み込んだ半教師型正準相関分析(SemiCCA)によりトピックを表現する潜在変数の空間を構築し,カーネル密度推定法を半教師化した多クラスSSKDEによって潜在変数空間上のモデル学習を行う,トピックモデルに基づく半教師型の学習手法である.この手法は画像認識・検索の分野において提案されたものであるが,音響信号に対する適用もスムーズに行うことができる.実際の音楽データを用いた実験により,使用できるタグ付き音響信号が少ない状況下でも,SSCDEを用いて半教師型の学習を行うことにより,タグ付け性能が向上することを確認した.
- 社団法人電子情報通信学会の論文
- 2010-12-02
著者
-
木村 昭悟
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
亀岡 弘和
NTTコミュニケーション科学基礎研究所
-
杉山 将
東京工業大学情報理工学研究科
-
木村 昭悟
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
木村 昭悟
東京工業大学工学部電気電子工学科
-
亀岡 弘和
日本電信電話株式会社
-
杉山 将
東京工業大学
-
大石 康智
NTTコミュニケーション科学基礎研究所
-
大石 康智
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
木村 昭悟
日本電信電話(株)コミュニケーション科学基礎研究所
-
亀岡 弘和
東京大学大学院情報理工学系研究科|nttコミュニケーション科学基礎研究所
-
杉山 将
東京工業大学 大学院情報理工学研究科
-
高木 潤
東京工業大学大学院情報理工学研究科
-
山田 誠
東京工業大学大学院情報理工学研究科
-
大石 康智
日本電信電話(株)nttコミュニケーション科学基礎研究所
関連論文
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- スパース正則化およびマルチカーネル学習のための最適化アルゴリズムとCV・PRへの応用(CV・パターン認識のための学習・最適化)
- Density Ratio Estimation : A Comprehensive Review (Statistical Experiment and Its Related Topics)
- Density ratio estimation: a comprehensive review (Statistical experiment and its related topics--RIMS共同研究報告集)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 1.多重音解析と自動採譜(音楽情報処理技術の最前線)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 自動採譜技術の展望
- スペクトル制御エンベロープによる混合音中の周期および非周期成分の選択的イコライザ
- 認識理解への認知発達的アプローチ (パターン認識・メディア理解)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- AS-5-5 複合ソースフィルタモデルによる音響信号の三要素テンソル分解(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- 調波時間構造化クラスタリング(HTC)による音楽音響特徴量の同時推定
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 調波時間構造化クラスタリングによるCASAへのアプローチ
- 調波構造・時間包絡・音色の統合的クラスタリングによる楽音分析(音楽音響信号処理 (2))
- 新博士によるパネルディスカッション1「博士への道のりと将来の夢」(パネルディスカッション)
- AS-6-3 EMアルゴリズムを用いた最尤時間周波数マスキングによる雑音環境下での2ch BSS(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
- ハーモニッククラスタリングと情報量規準による音楽の音高/音源数の推定(山下記念研究賞受賞記念講演)
- 音声認識技術を用いた音楽情報処理
- Specmurtにおける凖最適共通調波構造パターンの反復推定による多声音楽信号の可視化とMIDI変換(音楽音響信号認識)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(第5回音声言語シンポジウム : ポスターセッション)
- ハーモニック・クラスタリングによる多重音信号音高抽出における音源数とオクターブ位置推定(音楽音響信号認識/生成1)
- ハーモニック・クラスタリングによる多重音の基本周波数推定アルゴリズム
- ハーモニッククラスタリングによる多重音の基本周波数推定
- Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集し,合成できるインタフェース
- 無限状態スペクトルモデルによる音楽音響信号の解析
- 可変基底NMFに基づく音楽音響信号の解析
- Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
- 手の自然な動きを考慮した隠れ変数付き隠れマルコフモデルに基づくピアノ運指決定(ピアノ)
- 隠れマルコフモデルに基づくピアノ運指の自動決定
- 相平面に描かれるF0の動的変動成分を利用した歌唱様式の自動分類
- 映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- グローバルな枝刈りを導入した音や映像の高速探索
- 区分線形写像に基づく音響信号の高速探索
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 周波数領域のDPマッチングによる自然楽器演奏の和音ピッチ推定
- 線形2次系を利用した歌声のF0ダイナミクスの統計的モデル化と分析(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 相平面に描かれるF_0の動的変動成分を利用した歌唱様式の自動分類
- 正弦波重畳モデルのパラメータ最適化アルゴリズムの導出(ブラインド信号処理/一般)
- 音声スパース性に基づく2chBSSへのEMアルゴリズムの適用(ブラインド信号処理/一般)
- 事後確率最大化Specmurt分析による多重ピッチの反復推定アルゴリズム
- 凸射影法に基づくSpecmurt分析の共通調波構造推定
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- インデックス検索の情報理論的解析
- スペクトログラムのベイジアンノンパラメトリックモデリングに基づく音楽信号の解析
- TRECVID 2010 Instance Searchタスク参加報告(テーマセッション,映像処理とTRECVID)
- 対話型映像認識理解における動的学習戦略に関する取り組み(テーマセッション,PRMUのフロンティア・グランドチャレンジ)
- 半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索(一般セッション,PRMUのフロンティア・グランドチャレンジ)
- ガウス基底音響ストリームモデルを用いた時空間クラスタリングによる多重スペクトル分離
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(ポスターセッション)(第5回音声言語シンポジウム)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(第5回音声言語シンポジウム : ポスターセッション)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定
- F0パターン生成過程の確率モデルによる藤崎モデルパラメータの推定
- 声質空間上での変換に基づく歌声らしさの転写に関する検討
- 楽譜の文脈自由2次元木構造表現に基づく多重音スペクトログラム生成モデルによる音響信号からの自動採譜
- 補助関数法によるMIDI信号の音楽音響信号への詳細なフィッティング
- 数理モデルによる音楽情報処理(招待講演,時系列パターン認識)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション(実世界センシングとその応用)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション(実世界センシングとその応用)
- 数理モデルによる音楽情報処理(招待講演,時系列パターン認識)
- 入出力隠れマルコフモデルの復号によるギターのための自動編曲
- 人間の視覚的注意の計算モデル(サーベイセッション,人の視聴覚情報処理とPRMUの接点)
- 非負制約下における複合行列分解
- 人間の視覚的注意の計算モデル(サーベイセッション,人の視聴覚情報処理とPRMUの接点)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- モンドリアンHMMによる音楽信号の解析(テーマセッション,自然言語とパターン認識の境界)
- モンドリアンHMMによる音楽信号の解析(テーマセッション,自然言語とパターン認識の境界)
- 画像検索でのユーザ行動を利用した大規模画像アノテーション(一般物体認識,文字・文書,映像,医用画像,画像の認識・理解論文)
- sNMF:非負値制約下における複数行列の同時分解法 : ソーシャルメディア解析を応用例として(第15回情報論的学習理論ワークショップ)
- シーンの色情報と深度情報の統合による自動物体セグメンテーション
- ACM Multimedia 2013参加報告と関連研究動向
- 関係データ解析のための長方形分割過程 (情報論的学習理論と機械学習)
- 大規模マルチメディア解析コーパスとしてのsocial curationの可能性(特別講演,大規模データベースとパターン認識)
- 非負制約下における複合行列分解とそのソーシャルメディア解析への応用
- 画像検索でのユーザ行動解析に基づく大規模画像アノテーション
- SNSを利用したトピックモデルによる画像へのユーザ嗜好性の解析(テーマセッション,大規模データベースとパターン認識)
- 人間の視覚的注意の計算モデル
- 人間の視覚的注意の計算モデル