MRFに基づく情報統合モジュールの作成とその音楽情景分析への適用
スポンサーリンク
概要
- 論文の詳細を見る
われわれは,聴覚的情景分析(Auditory Scene Analysis)の研究の一段階として,音楽情景分析(Music Scene Analysis)の研究を行っている.音楽情景分析とは,音楽演奏から単音や和音などを記号として抽出することであり,将来的には,音楽に関する内容検索などへの応用が期待できる.音楽情景分析に関しては,既に,木構造の確率ネットワークに基づく音楽情景分析システムが提案されている.このシステムは,音楽のアンサンブル演奏を入力とし,これに含まれる周波数成分・単音・和音を楽器種類別に抽出して,楽譜に類似した形式などの形で出力するものである.これまでに,単音や和音のレベルでの情報統合の有効性を示す評価実験が行われていたが,実験システムの単音認識精度を検討したところ,確率ネットワークの構造が原理的に木に限定されていることが単音認識精度に限界をもたらす一因であることが明らかになった.そこで本稿では,その問題点を緩和するために確率ネットワークの構造の拡張を考え,一般の構造のネットワークに対して適用可能な情報統合モジュールを作成する.
- 社団法人情報処理学会の論文
- 1996-09-04
著者
-
柏野 邦夫
日本電信電話(株)基礎研究所 情報科学研究部
-
柏野 邦夫
Ntt基礎研究所情報科学研究部
-
萩田 紀博
NTTコミュニケーション科学研究所
-
萩田 紀博
NTT 基礎研究所
-
萩田 紀博
Nttコミュニケーション科学基礎研究所
関連論文
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- 2値多重音響特徴ベクトルを用いた類似音楽探索法の頑健性評価
- マルチメディアコンピューティング〔VI・完〕 : 知的メディア処理
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 適応型混合テンプレートを用いた音源同定 : 音楽演奏への適用
- アンサンブル実演奏の自動アンミキサ
- 適応型混合テンプレートを用いた音源同定 : 複数楽器演奏への適用
- 音声分離と楽音分離の統合のための音オントロジーの提案
- 背景音楽つき音声に対する音響ストリームの分離
- 背景音楽つき音声に対する音響ストリームの分離
- MRFに基づく情報統合モジュールの作成とその音楽情景分析への適用
- MRFモデルに基づく周波数成分の抽出
- 聴覚的情景分析(音環境理解)ワークショップ参加報告
- 木構造の確率ネットワークに立脚した音楽情景分析システムにおける認識誤りの分析とその改善手法
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- AS-5-5 複合ソースフィルタモデルによる音響信号の三要素テンソル分解(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- 実環境で収録された映像断片をキーとする一致映像探索(マルチメディア応用,画像の認識・理解論文)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集し,合成できるインタフェース
- Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
- 歩行動作特性からの年齢層の推定
- ユーザとのコミュニケーションにおける擬人化エージェントの視線移動制御
- 複数情報が重畳した尺八譜認識に関する一検討
- 周囲文字を含んだ参照パターンによる本棚画像中の文字認識
- 辞書の自動選択による本棚画像中の文字認識
- 複数情報が重畳した文字列認識の一検討 : 尺八譜認識の例
- 映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 実環境で受音した楽音をキーとする楽曲探索法(パターン認識)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- 携帯カメラで収録した映像をキーとする一致映像探索
- グローバルな枝刈りを導入した音や映像の高速探索
- LI-18 携帯電話で受音した音をキーとする音響信号探索(I. 画像認識・メディア理解)
- 区分線形写像に基づく音響信号の高速探索
- 時系列アクティブ探索法のための特徴ひずみに頑健な確率デイザボーテイング (画像の認識・理解論文特集)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 多値画像中の文字列切り出しに関する一検討
- 賛助会員のページ : コミュニケーション科学の研究
- 21世紀の文字認識研究に期待すること
- 見る,聞く,話すコンピュータを目指して--メディア情報研究の過去,現在,未来 (特集論文1 コミュニケーション科学10年の歩み)
- ヒューマノイド・テクノロジー&サイエンス研究の特集にあたって (特集論文 ヒューマノイド・テクノロジー&サイエンス研究)
- 線形2次系を利用した歌声のF0ダイナミクスの統計的モデル化と分析(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 多数の小領域スペクトログラムの探索に基づく背景音楽の高速探索法(音楽情報処理)
- 2値多重音響特徴ベクトルを用いた類似音楽探索とその高速化(マルチメディアパターン処理)
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- ヒストグラム特徴系列に基づく長時間音響信号の高速探索
- 音の流れを認識して楽器を聞き分けるコンピュータ (特集論文 ヒューマノイド・テクノロジー&サイエンス研究)
- 音や映像を瞬時に探す時系列アクティブ探索法
- ヒストグラム特徴を用いた音響信号の高速探索法 : 時系列アクティブ探索法
- オーバースキッピングによる時系列アクティブ探索法の高速化
- 時系列アクティブ探索法における音響信号の高速AND/OR探索
- 複数の音響信号の高速探索 -参照信号のOR探索における照合回数削減-
- 単音連繋確率ネットワークに基づく音楽演奏の音源同定
- マルチモーダルアクティブ探索を用いた画像・音響時系列の高速探索
- ヒストグラム特徴系列に基づく長時間音響信号の高速探索
- パート譜を用いたボーカル音 分離システム
- アンサンブル実演奏の自動アンミキサ
- 適応型混合テンプレートを用いた音源同定 : 複数楽器演奏への適用
- 多数の小区間信号の探索に基づく背景音楽の探索
- 多数の小区間信号の探索に基づく背景音楽の探索
- D-12-22 メディア探索のための曖昧文字列照合の高速計算法
- 類似度に基づく曖昧文字列照合法と音楽検索への適応
- DT-3-1 長時間メディアの高速時系列探索(DT-3. 長時間メディア処理のためのパターン認識・メディア理解の基盤技術, 情報・システム2)
- 音楽を聞き分けるコンピュータ(「音楽情報処理研究への誘い特集号」)
- 石塚 満 (著), 知識の表現と高速推論, 丸善, 296p, 4,326円, 1996年, ISBN4-621-04206-8
- 適応的領域分割と初期しきい値推定によるテンプレートマッチングの高速化(画像・映像処理)
- TRECVID 2010 Instance Searchタスク参加報告(テーマセッション,映像処理とTRECVID)
- TRECVID 2010 Content-Based Copy Detectionタスク参加報告(テーマセッション,映像処理とTRECVID)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム (パターン認識・メディア理解)
- ロボット発話の冗長性制御による指示物体認識性能向上への寄与
- 店舗内での顧客の停留領域系列に基づいたロボットからの商品推薦(知能ロボット,ライフログ処理技術とその活用システム論文)
- DP-1-3 多地点を連携して動くロボットサービス実証実験 : ユビキタスネットワークロボット・プラットフォーム(DP-1.クラウドネットワークロボットのワイガヤ実験場の実現に向けて,パネルセッション,ソサイエティ企画)
- 多重領域ヒストグラムを用いた高速なウィンドウサーチ(物体認識,文字・文書,医用画像,第14回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- コミュニケーションロボットによる道案内 : ジェスチャの有用性と発話タイミングのモデル化(人工知能,データマイニング)
- 18・4 総務省系プロジェクト(18.ロボティクス・メカトロニクス,機械工学年鑑)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 市街地構造物への拡張現実型画像情報提示手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 2.クラウドネットワークロボット関連技術の動向(クラウドネットワークロボット-クラウド化で広がる新たなネットワークロボットの可能性-)
- 分散カメラ間におけるグループ特徴量を用いた人追跡
- 市街地構造物への拡張現実型画像情報提示手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 生活環境で動作するロボットと人とのインタラクションについての研究動向(アンビエント情報基盤)
- H-043 識別的モデルによる人群3次元座標からのグループ推定(人物検出・移動検知,H分野:画像認識・メディア理解)
- H-012 距離センサを用いた特定動作に対する動作判定システムの開発(顔・ジェスチャ,H分野:画像認識・メディア理解)
- 高齢者の発話機会の増加のためのソーシャルメディア仲介ロボット(ビッグデータで変わる環境知能とロボット,及びその他一般)
- インタラクション機能を持つ掃除ロボットを用いた人とロボットの協調作業(ビッグデータで変わる環境知能とロボット,及びその他一般)
- 視覚情報を用いた歩行者への注意喚起効果の検討
- 局所的な画像特徴を利用した投票に基づく高速顔位置・姿勢推定(高精細度画像処理・表示,一般)
- 公道における自動車内Wi-Fi通信が相互に与える影響の検討(災害対応クラウドネットワークロボット・その他一般)