木構造の確率ネットワークに立脚した音楽情景分析システムにおける認識誤りの分析とその改善手法
スポンサーリンク
概要
- 論文の詳細を見る
これまでに柏野らは,木構造の確率ネットワークに基づく音楽情景分析(音楽音響信号を対象とする聴覚的情景分析)の処理モデルを提案し,実験システムを構築した.ここで聴覚的情景分析とは,人間が一つのものとして知覚または認識するような音響エネルギーのまとまりを記号化し,外界の音響事象に関する階層的な記述を生成することを指す.構築した実験システムは,音楽のアンサンブル演奏を入力とし,これに含まれる周波数成分・単音・和音を楽器種類別に抽出して,楽譜に類似した形式などの形で出力するものである.これまでに,情報統合の有効性を示す評価実験が行われていたが,認識誤りに関する詳細な分析はまだ行われていなかった.そこで本稿では,特に単音の階層に着目して,認識精度の観点から実験システム構成上の問題点を分析し,その改善手法について議論する.
- 社団法人情報処理学会の論文
- 1995-09-20
著者
関連論文
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- 2値多重音響特徴ベクトルを用いた類似音楽探索法の頑健性評価
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 適応型混合テンプレートを用いた音源同定 : 音楽演奏への適用
- アンサンブル実演奏の自動アンミキサ
- 適応型混合テンプレートを用いた音源同定 : 複数楽器演奏への適用
- 音声分離と楽音分離の統合のための音オントロジーの提案
- 背景音楽つき音声に対する音響ストリームの分離
- 背景音楽つき音声に対する音響ストリームの分離
- MRFに基づく情報統合モジュールの作成とその音楽情景分析への適用
- MRFモデルに基づく周波数成分の抽出
- 聴覚的情景分析(音環境理解)ワークショップ参加報告
- 木構造の確率ネットワークに立脚した音楽情景分析システムにおける認識誤りの分析とその改善手法
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- AS-5-5 複合ソースフィルタモデルによる音響信号の三要素テンソル分解(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- 実環境で収録された映像断片をキーとする一致映像探索(マルチメディア応用,画像の認識・理解論文)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- ヒューマノイドロボットの Subtle Expressions による感情モーション修飾手法
- Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集し,合成できるインタフェース
- Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
- 映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 実環境で受音した楽音をキーとする楽曲探索法(パターン認識)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- 携帯カメラで収録した映像をキーとする一致映像探索
- グローバルな枝刈りを導入した音や映像の高速探索
- LI-18 携帯電話で受音した音をキーとする音響信号探索(I. 画像認識・メディア理解)
- 区分線形写像に基づく音響信号の高速探索
- 時系列アクティブ探索法のための特徴ひずみに頑健な確率デイザボーテイング (画像の認識・理解論文特集)
- 「パターン認識・理解」から「パターン認識・メディア理解」へ
- 劣化文字にロバストな識別関数の学習に関する検討
- 消費エネルギー抑制ホームネットワーク技術のためのライフスタイルの分析
- J-034 情報提示方法の違いがもたらすロボットサイネージの広告効果(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)
- RJ-008 ヘルスケアロボットへのパーソナリティ付与による説得効果(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- RJ-007 ロボットサイネージにおいて見かけと大きさの違いがもたらす広告効果の変化検証(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 統計的画像認識における画像選別空間の構成法
- 手書き文字認識技術の動向
- 統計的画像認識における射影追跡に基づく画像選別
- 背景に雑音を含む2値画像認識法
- 統計的画像認識における射影追跡に基づく前処理
- 2値テンプレートパターンによるデザイン文字認識
- 統計的画像認識における射影追跡に基づく前処理
- 2値テンプレートパターンによるデザイン文字認識
- NTT基礎研究所
- LRFとカメラを利用した商業施設における歩行者行動の分類(ITS画像処理,映像メディア,視覚及び一般)
- 倒立振子移動機構を持つ人型ロボットの反応動作の違いが人に与える印象の変化
- 店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現
- ユビキタスマーケットプラットフォームにおける店舗内外連携による顧客案内動作の実現
- DP-1-3 異種ロボット連携による買い物支援(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
- DP-1-2 ユビキタスネットワークロボット研究開発プロジェクト : 全体像と中間成果総括(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
- 物体指示対話におけるクロスモーダル効果
- ロボットの耳打ち行為による説得効果
- デザイン処理された新聞見出し画像の文字認識法
- 補完類似度に基づく新聞見出し文字の領域抽出と認識
- 補完類似度による劣化印刷文字認識
- LRFとカメラを利用した商業施設における歩行者行動の分類(ITS画像処理,映像メディア,視覚及び一般)
- LRFとカメラを利用した商業施設における歩行者行動の分類(ITS画像処理,映像メディア,視覚及び一般)
- 店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現(ライフサポート,グループウェアとネットワーク,ライフログ活用技術,一般)
- コミュニケーションロボットによる領域参照のための直示的インタラクションのモデル化
- 複数の案内ロボットが連携してサービス提供するネットワークロボットシステムの実現
- twitterを用いた即応性の高いQ&A仲介エージェントの提案(一般セッション(1),クラウドでつながるロボットサービス)
- ロボットの能動的接触は人間のモチベーションを上げるか(エージェントデザイン,人とエージェントのインタラクション論文)
- コミュニケーションロボットのための発話とジェスチャのアサインパターンの抽出とその発展的開発手法の提案(対話生成,人とエージェントのインタラクション論文)
- 人々との身体的なインタラクションを行う小型ロボットのための慣性センサを用いた個人同定手法の確立(ユーザ状態推定,人とエージェントのインタラクション論文)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム (パターン認識・メディア理解)
- ロボット発話の冗長性制御による指示物体認識性能向上への寄与
- 店舗内での顧客の停留領域系列に基づいたロボットからの商品推薦(知能ロボット,ライフログ処理技術とその活用システム論文)
- クラウドによるロボットの発話とジェスチャのアサインパターンの抽出とその発展的開発手法(地理空間情報とロボットと人と)
- 対話行動認識プラットフォーム
- DP-1-3 多地点を連携して動くロボットサービス実証実験 : ユビキタスネットワークロボット・プラットフォーム(DP-1.クラウドネットワークロボットのワイガヤ実験場の実現に向けて,パネルセッション,ソサイエティ企画)
- グラフカットを利用した視体積交差法と多視点ステレオから得られた点群の統合(実世界センシングとその応用)
- グラフカットを利用した視体積交差法と多視点ステレオから得られた点群の統合(実世界センシングとその応用)
- グラフカットを利用した視体積交差法と多視点ステレオから得られた点群の統合(実世界センシングとその応用)
- 領域特徴量による複雑背景下での人体姿勢推定(実世界センシングとその応用)
- 領域特徴量による複雑背景下での人体姿勢推定(実世界センシングとその応用)
- 領域特徴量による複雑背景下での人体姿勢推定(実世界センシングとその応用)
- コミュニケーションロボットによる道案内 : ジェスチャの有用性と発話タイミングのモデル化(人工知能,データマイニング)
- 18・4 総務省系プロジェクト(18.ロボティクス・メカトロニクス,機械工学年鑑)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 2.クラウドネットワークロボット関連技術の動向(クラウドネットワークロボット-クラウド化で広がる新たなネットワークロボットの可能性-)
- 分散カメラ間におけるグループ特徴量を用いた人追跡
- 顧客の軌跡データを利用した実購買行動解析による購買・非購買推定(行動解析,ユーザ属性情報,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,一般)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 生活環境で動作するロボットと人とのインタラクションについての研究動向(アンビエント情報基盤)
- H-043 識別的モデルによる人群3次元座標からのグループ推定(人物検出・移動検知,H分野:画像認識・メディア理解)
- H-012 距離センサを用いた特定動作に対する動作判定システムの開発(顔・ジェスチャ,H分野:画像認識・メディア理解)
- 高齢者の発話機会の増加のためのソーシャルメディア仲介ロボット(ビッグデータで変わる環境知能とロボット,及びその他一般)
- インタラクション機能を持つ掃除ロボットを用いた人とロボットの協調作業(ビッグデータで変わる環境知能とロボット,及びその他一般)
- 視覚情報を用いた歩行者への注意喚起効果の検討
- 局所的な画像特徴を利用した投票に基づく高速顔位置・姿勢推定(高精細度画像処理・表示,一般)
- 公道における自動車内Wi-Fi通信が相互に与える影響の検討(災害対応クラウドネットワークロボット・その他一般)
- 高精細3次元ビデオのためのズームアップ・パンチルト撮影システム(画像認識,コンピュータビジョン,システム開発論文)
- 軌跡間の時空間特徴量を用いた人のグループ検出(パターン認識)