音楽単音記号列生成システムの処理モデルOPTIMAにおける単音仮説生成処理
スポンサーリンク
概要
- 論文の詳細を見る
われわれは、音楽単音記号列生成システムにおける処理モデルとしてOPTIMAを提案した。[1]OPTIMAでは、モジュールが確信度をもった仮説の組を出力する場合、これを確率伝搬によって統合することができる。したがって、音楽単音記号列生成システムのように複数の情報を統合する必要がある場合には、有用な処理モデルであるということができる。OPTIMAの処理のうち本稿で扱う単音仮説生成モジュールでは、各仮説に確信度を与えなければならないため、確信度の与え方が問題である。このような確信度を与える単音仮説生成モジュールとして、音記憶を使用したモジュールが実装されている。このモジュールは音記憶から生成した混合音仮説と入力とのマッチングを行うモジュールであり、和音などの混合音の認識に効果的であった。しかし、一音ごとに音記憶が必要であること、および混合音数の増加にともない計算量が爆発してしまうことなど、効率、精度の面で音記憶だけでは限界があった。そこで、これらの問題を解決するために音色としての本質的な特徴を抽出し、音色空間上に表現を行った。このような音色空間を利用した楽器の類別、認識の研究はニューラルネットワークを使用したものなどがあり、単音に関しては良好な結果が得られている。そこで、本稿では音色空間の利用により、確信度をもった仮説の組を出力し、混合音に対しても認識を行うことができる単音仮説生成法を提案する。この手法では、各単音仮説の確信度は統計的手法により算出することができ、知識は音色ごとに与えられるため、音数に対する知識量の爆発、計算量の爆発を抑えることができる。
- 社団法人情報処理学会の論文
- 1994-09-20
著者
関連論文
- AIチャレンジ研究会(SIG-Challenge)(研究会総覧)
- Botnetの命令サーバドメインネームを用いたBot感染検出方法(セッション1)
- ロボット聴覚オープンソースソフトウエアHARK
- 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚
- 「ロボット聴覚」特集について
- 実物体を扱う遠隔協調作業を支援する壁面投影移動型アバタシステム Remy の提案
- ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用
- 4.音楽ロボットのための実時間音楽情報処理(音楽情報処理技術の最前線)
- 多段処理によるブラインド残響抑圧処理の性能向上
- 環境変動を考慮したロボット聴覚のための音源分離
- ARTによる単語の出現頻度処理を応用した概念関係の獲得
- 科学者倫理の確立に向けて声明表出に際しての会長談話, 声明「科学者の行動規範について」
- ICOTone : 立派なベースLPB88
- L-022 仮想マシンモニタにおけるデバイスドライバ安全性向上に関する提案(L分野:ネットワーク・セキュリティ)
- 分散システムにおけるCapabilityを用いた資源アクセス制御
- アプリケーション・プラットフォームとしてのセキュアOSに関する初期的検討
- M_053 分散環境におけるセキュアな資源管理方式に関する研究(M分野:アーキテクチャ・ユビキタス・セキュリティ)
- 対話的整形による幾何学的図形の高速描画(次世代ヒューマンインタフェース・インタラクション)
- 自動認識整形機能をもったペンによる描画システム
- 音楽情景分析の処理モデルOPTIMAにおける和音の認識
- 音楽情景分析の処理モデルOPTIMAにおける単音の認識
- 音楽情景分析の処理モデルOPTIMAにおける統計的単音仮説生成処理
- 音楽情景分析の処理モデルOPTIMAにおけるシーン情報の抽出と利用
- 音楽情景分析の処理モデルOPTIMAの実装
- 処理モデルOPTIMAに基づく音楽情景分析システムの構築 II : 情報統合の実現と評価
- 処理モデルOPTIMAに基づく音楽情景分析システムの構築 I : 各処理モジュールの実現と評価
- 音楽単音記号列生成システムの処理モデルOPTIMAにおける単音仮説生成処理
- OPTIMA : 音楽音響信号から単音記号列を生成するシステムの処理モデル
- 1. 計算機への音楽の入力 : 「音」の分離抽出の難しさ ( 音楽情報処理
- 音楽音響信号から単音記号列を生成するシステムOPTIMAの全体像
- 音源分離システムにおけるパターン照合モジュールの動的負荷分散を用いた並列実装
- 二つの周波数成分の分離知覚に関する工学的モデル : 複数の要因の評価と統合
- 音源分離システムにおけるパターン照合モジュールの並列実装と評価
- 音源分離システムにおける音モデルの自動獲得 : II : ボトムアップ処理と音モデルに基づく処理との協調
- 音源分離システムにおける音モデルの自動獲得 : I : 音モデルの抽象化
- 音楽音響信号を対象とする音源分離システム : 音モデルに基づくアプローチ
- RDTネットワークにおける疑似フルマップ方式の評価
- ディレクトリキャッシュにおける疑似フルマップシステムの定量的評価
- ニューラルネットワークを用いた分業TSPの解法
- 医療分野におけるRFIDタグシステムの情報セキュリティの確保(セッション1-B:セキュリティ応用技術)
- シンクライアントアーキテクチャをベースにしたセキュアクライアントの検討
- 英語名詞の多義性解消における文脈としての場面情報の評価
- 談話解析に基づく場面の同定とその評価
- 場面情報に基づく英語名詞の語義の優先づけ方法と評価
- 結束構造および一貫性に基づく場面構造の解析
- 分業巡回セールスマン問題のニューラルネットワークによる解法
- 辞書ベースの連想記憶に基づく日常生活場面の同定
- 辞書ベースの連想記憶による文脈理解のための場面同定機構
- 辞書ベース連想による場面同定に必要な文脈情報量の推定
- 連想推論における逐次学習方式の定式化とその評価 : 曖昧性解消に必要な文脈情報の定量化
- ニューラルネットワークと記号処理の統合による連想補完文字認識
- PDAI&CDに基づく意味の学習および文脈依存の多義性解消 : 神経回路網と論理記号処理の統合による連想推論
- 神経回路網に基づく超並列連想システムWAVE
- 論理プログラミングを基礎とした認可ポリシ記述言語
- 室内マイクロホンアレイを用いた実時間発話方向推定
- 相互結合網RSOTのルーチング方式
- 機密情報共有に有用な情報フロー制御モデルの提案
- ネットワーク仮想化機構とその評価
- PIE64の通信機能の測定
- 並列計算機PIE64の通信機能の評価
- VLDP3アーキテクチャにおけるメモリリネーミング手法の検討
- VLDP3アーキテクチャにおけるレジスタ値の高速Forwarding手法の提案
- VLDP3 : データフローを高速実行する大規模アーキテクチャ
- C-16 VLDP3アーキテクチャの構想(3) : レジスタフォワーディング機構の初期検討(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-15 VLDP3アーキテクチャの構想(2) : ソフトウェア支援(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-14 VLDP3アーキテクチャの構想(1) : プロセッサ構成(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- 2000-HPC-82-19 コンパイラによるロード・ストア負荷の軽減
- 実行サイクル数予測に基づく大域的命令スケジューリングの実装と評価
- 2D-3 予測実行サイクル数に基づいた大域的命令スケジューリング
- 「分散処理特集号」の編集にあたって
- 高並列推論エンジンPIEにおけるゴールフレーム表現方式の評価
- スペルベルの象徴解釈モデルに基づく隠喩の検出
- 単語の頻度情報を応用した文の評価
- ARTを利用した多義語の分類とその評価
- ARTを用いた自然言語中の単語の頻度の情報処理 : 文書クラスタリングによる単語の連想関係の取得
- 効率的なセキュリティ要求分析手法の提案
- デジタル教材の著作権料分配方法の提案-新電子教科書プロジェクト-
- マルウェア亜種の動的挙動を利用した自動分類手法の提案と実装
- メンバの入れ替えが生じる環境下でのマルチキャスト通信の暗号化鍵管理方法の評価・検討(情報通信基礎サブソサイエティ合同研究会)
- メンバの入れ替えが生じる環境下でのマルチキャスト通信の暗号化鍵管理方法の評価・検討(情報通信基礎サブソサイエティ合同研究会)
- メンバの入れ替えが生じる環境下でのマルチキャスト通信の暗号化鍵管理方法の評価・検討(情報通信基礎サブソサイエティ合同研究会)
- セキュアなアプリケーション開発のための要求・デザインパターンの提案(セッション5-B:セキュアプロトコルとセキュアソフトウェア開発)
- サイバーワールド論文特集の発行にあたって
- O-010 情報システムへのオープンソースソフトウェア導入に関するガイドライン策定(O分野:情報システム)
- L-034 自己組織化マップを用いた異常検知についての一検討(L分野:ネットワーク・セキュリティ)
- L-033 C&Cセッション分類によるボットネットの検出手法の一検討(L分野:ネットワーク・セキュリティ)
- メモリアクセスの時間的周期性を利用した動的データプリフェッチ機構
- 隠喩理解 : 連想網と意味ネットワークとの整合
- AI-1-3 ロボット聴覚オープンソースソフトウエアHARK(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)
- 6J-8 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6J-7 ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- アクティブオーディションによる自然なヒューマン・ロボットインターフェースの実現に関する研究(認知と身体性)(人工知能分野における博士論文)
- 音楽音響信号を対象とする音モデルに基づく音源分離システム
- ロボット聴覚用オープンソースソフトウェアHARKの展開 (特集 世界に飛び出す日本のソフトウェア)
- ロボットを対象とした二階層視聴覚統合音声認識システム
- 多数の人の声を一度に聞き分ける聴覚技術 : 聖徳太子ロボットを目指して
- ロボット聴覚 : 高雑音下でのハンズフリー音声認識(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 情報統合によるインテリジェント人追跡(クラウドで始まる新たなネットワークロボット)
- 2-2 混合音を聞き分けるセンシング技術(2.人間をセンシングする技術,人間を理解するためのICT技術-人間を対象としたセンシング・情報処理からその応用まで-)
- マルチモーダル情報統合によるインテリジェント人追跡システム