音楽音響信号を対象とする音源分離システム : 音モデルに基づくアプローチ
スポンサーリンク
概要
- 論文の詳細を見る
音モデルに基づく音源分離システムについて述べる.本システムは,複数種類の楽器演奏を含むモノラルの音響信号を入力とし,これを楽器種ごとに分離して,演奏情報をMIDIデータおよび画面表示として出力するものである.音源の分離同定は,システムに蓄積された音モデルを用いて混合音仮説を生成し,これと入力音響信号のスペクトログラムとを照合することによって行われる.評価実験の結果,最大同時発音数3音という制限の下で,平均85%以上の認識率を得ることができた.本システムでは,音モデルは予めシステムに与えるものとしている.なお本稿では,スペクトログラムから周波数成分抽出を行う方法に関しても新たな提案を行っている.
- 社団法人情報処理学会の論文
- 1993-04-23
著者
関連論文
- AIチャレンジ研究会(SIG-Challenge)(研究会総覧)
- Botnetの命令サーバドメインネームを用いたBot感染検出方法(セッション1)
- ロボット聴覚オープンソースソフトウエアHARK
- 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚
- 「ロボット聴覚」特集について
- 実物体を扱う遠隔協調作業を支援する壁面投影移動型アバタシステム Remy の提案
- ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用
- 4.音楽ロボットのための実時間音楽情報処理(音楽情報処理技術の最前線)
- 多段処理によるブラインド残響抑圧処理の性能向上
- 環境変動を考慮したロボット聴覚のための音源分離
- ARTによる単語の出現頻度処理を応用した概念関係の獲得
- 科学者倫理の確立に向けて声明表出に際しての会長談話, 声明「科学者の行動規範について」
- ICOTone : 立派なベースLPB88
- L-022 仮想マシンモニタにおけるデバイスドライバ安全性向上に関する提案(L分野:ネットワーク・セキュリティ)
- 分散システムにおけるCapabilityを用いた資源アクセス制御
- アプリケーション・プラットフォームとしてのセキュアOSに関する初期的検討
- M_053 分散環境におけるセキュアな資源管理方式に関する研究(M分野:アーキテクチャ・ユビキタス・セキュリティ)
- 対話的整形による幾何学的図形の高速描画(次世代ヒューマンインタフェース・インタラクション)
- 自動認識整形機能をもったペンによる描画システム
- 音楽情景分析の処理モデルOPTIMAにおける和音の認識
- 音楽情景分析の処理モデルOPTIMAにおける単音の認識
- 音楽情景分析の処理モデルOPTIMAにおける統計的単音仮説生成処理
- 音楽情景分析の処理モデルOPTIMAにおけるシーン情報の抽出と利用
- 音楽情景分析の処理モデルOPTIMAの実装
- 処理モデルOPTIMAに基づく音楽情景分析システムの構築 II : 情報統合の実現と評価
- 処理モデルOPTIMAに基づく音楽情景分析システムの構築 I : 各処理モジュールの実現と評価
- 音楽単音記号列生成システムの処理モデルOPTIMAにおける単音仮説生成処理
- OPTIMA : 音楽音響信号から単音記号列を生成するシステムの処理モデル
- 1. 計算機への音楽の入力 : 「音」の分離抽出の難しさ ( 音楽情報処理
- 音楽音響信号から単音記号列を生成するシステムOPTIMAの全体像
- 音源分離システムにおけるパターン照合モジュールの動的負荷分散を用いた並列実装
- 二つの周波数成分の分離知覚に関する工学的モデル : 複数の要因の評価と統合
- 音源分離システムにおけるパターン照合モジュールの並列実装と評価
- 音源分離システムにおける音モデルの自動獲得 : II : ボトムアップ処理と音モデルに基づく処理との協調
- 音源分離システムにおける音モデルの自動獲得 : I : 音モデルの抽象化
- 音楽音響信号を対象とする音源分離システム : 音モデルに基づくアプローチ
- RDTネットワークにおける疑似フルマップ方式の評価
- ディレクトリキャッシュにおける疑似フルマップシステムの定量的評価
- ニューラルネットワークを用いた分業TSPの解法
- 医療分野におけるRFIDタグシステムの情報セキュリティの確保(セッション1-B:セキュリティ応用技術)
- シンクライアントアーキテクチャをベースにしたセキュアクライアントの検討
- 英語名詞の多義性解消における文脈としての場面情報の評価
- 談話解析に基づく場面の同定とその評価
- 場面情報に基づく英語名詞の語義の優先づけ方法と評価
- 結束構造および一貫性に基づく場面構造の解析
- 分業巡回セールスマン問題のニューラルネットワークによる解法
- 辞書ベースの連想記憶に基づく日常生活場面の同定
- 辞書ベースの連想記憶による文脈理解のための場面同定機構
- 辞書ベース連想による場面同定に必要な文脈情報量の推定
- 連想推論における逐次学習方式の定式化とその評価 : 曖昧性解消に必要な文脈情報の定量化
- ニューラルネットワークと記号処理の統合による連想補完文字認識
- PDAI&CDに基づく意味の学習および文脈依存の多義性解消 : 神経回路網と論理記号処理の統合による連想推論
- 神経回路網に基づく超並列連想システムWAVE
- 論理プログラミングを基礎とした認可ポリシ記述言語
- 室内マイクロホンアレイを用いた実時間発話方向推定
- 相互結合網RSOTのルーチング方式
- 機密情報共有に有用な情報フロー制御モデルの提案
- ネットワーク仮想化機構とその評価
- PIE64の通信機能の測定
- 並列計算機PIE64の通信機能の評価
- VLDP3アーキテクチャにおけるメモリリネーミング手法の検討
- VLDP3アーキテクチャにおけるレジスタ値の高速Forwarding手法の提案
- VLDP3 : データフローを高速実行する大規模アーキテクチャ
- C-16 VLDP3アーキテクチャの構想(3) : レジスタフォワーディング機構の初期検討(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-15 VLDP3アーキテクチャの構想(2) : ソフトウェア支援(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-14 VLDP3アーキテクチャの構想(1) : プロセッサ構成(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- 2000-HPC-82-19 コンパイラによるロード・ストア負荷の軽減
- 実行サイクル数予測に基づく大域的命令スケジューリングの実装と評価
- 2D-3 予測実行サイクル数に基づいた大域的命令スケジューリング
- 「分散処理特集号」の編集にあたって
- 高並列推論エンジンPIEにおけるゴールフレーム表現方式の評価
- スペルベルの象徴解釈モデルに基づく隠喩の検出
- 単語の頻度情報を応用した文の評価
- ARTを利用した多義語の分類とその評価
- ARTを用いた自然言語中の単語の頻度の情報処理 : 文書クラスタリングによる単語の連想関係の取得
- 効率的なセキュリティ要求分析手法の提案
- デジタル教材の著作権料分配方法の提案-新電子教科書プロジェクト-
- マルウェア亜種の動的挙動を利用した自動分類手法の提案と実装
- メンバの入れ替えが生じる環境下でのマルチキャスト通信の暗号化鍵管理方法の評価・検討(情報通信基礎サブソサイエティ合同研究会)
- メンバの入れ替えが生じる環境下でのマルチキャスト通信の暗号化鍵管理方法の評価・検討(情報通信基礎サブソサイエティ合同研究会)
- メンバの入れ替えが生じる環境下でのマルチキャスト通信の暗号化鍵管理方法の評価・検討(情報通信基礎サブソサイエティ合同研究会)
- セキュアなアプリケーション開発のための要求・デザインパターンの提案(セッション5-B:セキュアプロトコルとセキュアソフトウェア開発)
- サイバーワールド論文特集の発行にあたって
- O-010 情報システムへのオープンソースソフトウェア導入に関するガイドライン策定(O分野:情報システム)
- L-034 自己組織化マップを用いた異常検知についての一検討(L分野:ネットワーク・セキュリティ)
- L-033 C&Cセッション分類によるボットネットの検出手法の一検討(L分野:ネットワーク・セキュリティ)
- メモリアクセスの時間的周期性を利用した動的データプリフェッチ機構
- 隠喩理解 : 連想網と意味ネットワークとの整合
- AI-1-3 ロボット聴覚オープンソースソフトウエアHARK(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)
- 6J-8 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6J-7 ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- アクティブオーディションによる自然なヒューマン・ロボットインターフェースの実現に関する研究(認知と身体性)(人工知能分野における博士論文)
- 音楽音響信号を対象とする音モデルに基づく音源分離システム
- ロボット聴覚用オープンソースソフトウェアHARKの展開 (特集 世界に飛び出す日本のソフトウェア)
- ロボットを対象とした二階層視聴覚統合音声認識システム
- 多数の人の声を一度に聞き分ける聴覚技術 : 聖徳太子ロボットを目指して
- ロボット聴覚 : 高雑音下でのハンズフリー音声認識(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 情報統合によるインテリジェント人追跡(クラウドで始まる新たなネットワークロボット)
- 2-2 混合音を聞き分けるセンシング技術(2.人間をセンシングする技術,人間を理解するためのICT技術-人間を対象としたセンシング・情報処理からその応用まで-)
- マルチモーダル情報統合によるインテリジェント人追跡システム