発音時刻の楽譜上の位置を確率モデルにより推定するクォンタイズ手法(<特集>音楽情報科学)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, ジャムセッション等で伴奏に合わせて弾いた演奏の発音時刻から, 元々演奏者が弾こうとした正規化された楽譜上の発音時刻を推定する手法について述べる.本研究の目的は, 演奏を再利用しやすい形でデータベース上に蓄積するために, 演奏記録の発音時刻を量子化された位置に整列させることである.従来のビート・リズムの認識に関する手法の多くが拍位置の予測や推定に主眼を置いていたのに対し, 本手法では, テンポ一定で伴奏の拍位置が既知という条件下で, 発音時刻のゆらぎを取り除く問題, すなわちクォンタイズを扱う.和音を含むジャムセッションのMIDI演奏記録をクォンタイズするため, 我々は, 発音時刻の遷移とゆらぎを隠れマルコフモデルでモデル化する手法を提案する.本手法の特長は, モデルパラメータを演奏記録から統計的に学習することにより, 各演奏に適した確率モデルを使ってクォンタイズすることができる点である.演奏記録を学習し実験した結果, 市販のシーケンスソフトウェアの機械的なクォンタイズより性能が良く, モデルが有効に機能したことが示された.
- 社団法人情報処理学会の論文
- 2002-02-15
著者
-
大津 展之
筑波大学大学院システム情報工学研究科
-
麻生 英樹
産業技術総合研究所
-
大津 展之
産業技術総合研究所
-
浜中 雅俊
筑波大学大学院システム情報工学研究科
-
後藤 真孝
科学技術振興事業団さきがけ研究21「情報と知」領域
-
浜中 雅俊
日本学術振興会特別研究院pd:独立行政法人産業技術総合研究所
-
浜中 雅俊
科学技術振興機構
-
浜中 雅俊
筑波大学大学院 システム情報工学研究科
-
麻生 英樹
産業技術総合研 情報技術研究部門
関連論文
- 時間重みと外的規準を用いた動作評価手法(一般セッション2)
- 時間重みと外的規準を用いた動作評価手法(一般セッション1,三次元画像,多視点画像)
- 時間重みと外的規準を用いた動作評価手法(一般セッション1,三次元画像,多視点画像)
- ヒューマノイドロボットにおける音響シミュレーションの検討
- 線形計算の数理, 杉原正顯,室田一雄(著), 岩波書店, 2009-08, A5判, 定価(本体6,000円+税)
- 高次局所自己相関特徴による多チャンネル時系列データからの異常検知
- 高次局所自己相関特徴を用いた病理組織診断支援技術の研究
- 画像・単語間概念対応の確率構造学習を利用した超高速画像認識・検索方法(パターン認識・メディア理解のための学習理論とその周辺)
- 印象情報の付与による類似画像検索性能の評価(パターン認識)
- 2K-1 画像・単語列間の確率的な概念獲得による高速かつ高精度な汎用的画像認識・検索手法(情報爆発時代における実世界情報解析とロボット,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 音声・画像入力からの概念獲得のためのインターモーダル学習(マルチメディアとパターン認識理解,一般)
- 時系列データからの汎用的異常検知手法の提案とその性能評価
- 協調フィルタリングと属性ベースフィルタリングの統合について(ベイズ情報処理,ベイズ情報処理及び一般)
- パーティクルフィルタを用いたベイズ推論のユーザインタフェースへの応用(一般, 脳・ヒューマンモデリング, 一般)
- 嗜好のモデル化におけるモデル適応について(ヒトの行動とモデル,神経ダイナミクス,一般)
- ベイジアンネットによる映画コンテンツ推薦方式の検討(ベイジアンネット1 : ポスターセッション)
- Guitarist Simulator : 演奏者の振舞いを統計的に学習するジャムセッションシステム(音楽情報科学)
- CHLAC特徴とGridコンピューティングを併用したリアルタイム動作認識(一般セッション(2), 文字認識・文書理解)
- 1.仮想状況と現実状況における食事メニュー嗜好の差異について(一般セッション 認知・情報)
- 幾何学的拘束を考慮したバックミラー画像からの車両検出・追跡(一般セッション7)
- 幾何学的拘束を考慮したバックミラー画像からの車両検出・追跡(一般セッション(5),CVのためのパターン認識・学習理論の新展開)
- 直進する車載カメラの動画像からのオプティカルフローを用いた環境の形状復元法の検討(文書・文字メディアの認識・理解, 一般)
- 直進する車載カメラの動画像からのオプティカルフローを用いた環境の形状復元法の検討
- 同値類に基づく回転不変特徴量を用いた3次元物体モデルの類似検索(マルチメディアパターン処理)
- 実演奏音と楽譜情報からの演奏者識別に関する研究
- 1-3 感性への数理科学的なアプローチ(1.感性情報学の方法論,感性情報学)
- 広範囲動画像におけるCHLACによる異常検出
- 交通安全のための状況・意図理解に向けて(交通移動体事故の抜本的低減へ向けて)
- 学習するジャムセッションシステム : 演奏者固有のフレーズの獲得(セッション5 : 自動演奏システム)
- 発音時刻の楽譜上の位置を確率モデルにより推定するクォンタイズ手法(音楽情報科学)
- 学習に基づくクォンタイズ : 発音時刻の楽譜上の位置の推定
- 学習するセッションシステム : 演奏者の振る舞いのモデルの獲得
- 高次相関特徴によるテクスチャ解析の試み
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- 濃度値の量子化を考慮したしきい値選定法
- 画像の量子化誤差を考慮したしきい値選定法
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- パターン識別のための錐制約部分空間法(パターン認識)
- MRFモデルを用いた動画像からの移動物体検出(一般セッション16)
- 錘に基づくパターン識別方法(一般セッション14)
- MRFモデルを用いた動画像からの移動物体検出(一般セッション6,三次元画像,多視点画像)
- 錘に基づくパターン識別方法(一般セッション5,三次元画像,多視点画像)
- 類似画像検索における印象情報の寄与について
- 類似画像検索における印象情報の寄与について(コミュニケーション支援及び一般)
- マルコフ確率場のMAP推定による物体画像切り出し(テーマセッション(1),パターン認識・メディア理解のための学習理論とその応用)
- マルコフ確率場のMAP推定による物体画像切り出し
- 2.移動端末におけるユーザの状況を考慮した嗜好抽出技術(実世界上のユーザ行動に着目した嗜好抽出・情報推薦, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- シーンの重要度に応じて符号化効率を変化させる適応型動画像圧縮法
- 変分ベイズ法を用いたモデル構造探索に基づく抽象的単語の学習(人工知能,認知科学)
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習(テーマ関連セッション1)
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習
- ベイジアンネットワークモデルの構造学習におけるMDL規準の改善提案
- ベイジアンネットによる映画コンテンツ推薦方式の検討(好みの計量)
- 映画コンテンツ推薦のためのユーザ嗜好性モデルの実験的評価
- 視聴覚センサ情報の統合による音源追跡
- 多人数インタラクションの工学的応用 : 認識・理解システムの構築とその利用について(ワークショップ,言語・非言語コミュニケーション及び一般)
- ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(システム論文特集号)
- パーティクルフィルタを用いた移動音源の追跡技術
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 「ニューロラルな視点からの挑戦」へのコメントと回答
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習(テーマセッション(1),CVのためのパターン認識・学習理論の新展開)
- 直進する車載カメラの動画像からのオプティカルフローを用いた環境の形状復元法の検討(文書・文字メディアの認識・理解, 一般)
- MRFモデルを用いた動画像からの移動物体検出(一般セッション6,三次元画像,多視点画像)
- 錘に基づくパターン識別方法(一般セッション5,三次元画像,多視点画像)
- D-9-8 携帯電話上での行動予測モデルに関する検討(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
- 視覚情報から言語表現を生成するシステムの試作
- 少し離れたところから
- 知的であるとはどういうことか?
- インタラクションを通じた学習
- 類似画像検索における印象情報の寄与について(コミュニケーション支援及び一般)
- 階層ベイズモデルによる協調フィルタリング(一般講演(モデルとデータの統合),機械学習とその応用)
- 映画コンテンツ推薦のためのユーザ嗜好性モデルの実験的評価
- HLAC特徴を用いた照明変化に頑健な物体認識(一般セッション)
- 想定状況と現実状況における食事メニュー嗜好の差異の分析(一般,生物模倣情報処理,機械学習,一般)
- 1.座談会 ニューロコンピューティング研究から生まれたもの(ニューロコンピューティング研究の歴史とその将来)
- 疎な位置情報履歴からの有意位置抽出方式に関する検討(IBIS2010(情報論的学習理論ワークショップ))
- 2.ニューロコンピューティング研究から生まれたもの : 理論・応用的側面(ニューロコンピューティング研究の歴史とその将来)
- ニューロコンピューティング研究から生まれたもの : 理論・応用的側面
- 話者位置推定のためのベイジアンネットによる音響情報と画像情報の統合
- 自然言語処理の基礎, 奥村学(著), コロナ社, 2010-10, A5判, 定価(本体2,100円+税)
- D-20-1 通信履歴からの有意位置抽出方式の実験的評価(D-20.情報論的学習理論と機械学習,一般セッション)
- 情報・コンテンツのレコメンド技術と課題
- 音響入門シリーズ A-1音響学入門, 日本音響学会(編), 鈴木陽一,赤木正人,伊藤彰則,佐藤洋,苣木禎史,中村健太郎(共著), コロナ社, 2011-03, A5判, 定価(本体3,200円+税)
- 階層ベイズモデルによるモデル適応(一般及び雑音を有効利用する神経系やそのモデル)
- 階層ベイズモデルによるモデル適応(一般及び雑音を有効利用する神経系やそのモデル)
- 携帯電話通信時に得られる疎な位置情報履歴を用いた有意位置検出(データマイニング,ライフログ処理技術とその活用システム論文)
- ライフログ情報を利用する推薦サービス利用意向の分析(Web情報システム,ライフログ処理技術とその活用システム論文)
- D-20-1 通信履歴からの自宅職場推定手法の実験的評価(D-20.情報論的学習理論と機械学習,一般セッション)
- 報酬と行動決定を伴う時系列データの強化学習を用いたオフライン分析(一般,複雑系とニューロコンピューティング)
- 確率モデルからの記号の創発 : Bayesian Linguisticsに向けて(記号創発ロボティクス)
- OS-02 意味と理解のコンピューティング(オーガナイズドセッション報告,2012年度人工知能学会全国大会(第26回))
- クラス比の推定手法とTwitterデータからのユーザセグメント比の推定への応用(一般セッション 数学・統計(2))
- 多層ニューラルネットワークによる深層表現の学習(Deep Learning(深層学習)〔第2回〕)
- D-012 Twitter解析による通信品質低下傾向の早期検出手法の提案(マイクロブログ,D分野:データベース)
- 情報中立推薦での中立性項の改良(機械学習)
- 意味と理解のコンピューティング