高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
スポンサーリンク
概要
- 論文の詳細を見る
音響信号の種類毎にモデル化された高次統計量の分布を用いて、新たな入力の分布から音声と他の環境音を識別する手法について検討を行った。高次統計量として,独立成分分析などで用いられる尖度に着目した.尖度を確率変数とした確率密度関数を信号の種類毎に推定し,入力信号との平均対数尤度が安定して最大となる信号の種類を識別結果としたところ,提案手法は実験結果より特に単発性環境音と音声を区別するのに有効である可能性が示された.
- 一般社団法人情報処理学会の論文
- 2004-07-16
著者
-
浅野 太
産業技術総合研究所
-
麻生 英樹
産業技術総合研究所
-
北脇 信彦
筑波大学大学院
-
吉村 隆
産業技術総合研究所 情報処理研究部門
-
吉村 隆
産業技術総合研究所情報処理研究部
-
麻生 英樹
産業技術総合研 情報技術研究部門
-
浅野 太
産業技術総合研 情報技術研究部門
関連論文
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- ヒューマノイドロボットにおける音響シミュレーションの検討
- 線形計算の数理, 杉原正顯,室田一雄(著), 岩波書店, 2009-08, A5判, 定価(本体6,000円+税)
- ブラインド信号処理の最近の動向 : 超指数法と固有ベクトル法(ブラインド信号処理の技術とその応用論文)
- 協調フィルタリングと属性ベースフィルタリングの統合について(ベイズ情報処理,ベイズ情報処理及び一般)
- パーティクルフィルタを用いたベイズ推論のユーザインタフェースへの応用(一般, 脳・ヒューマンモデリング, 一般)
- 嗜好のモデル化におけるモデル適応について(ヒトの行動とモデル,神経ダイナミクス,一般)
- ベイジアンネットによる映画コンテンツ推薦方式の検討(ベイジアンネット1 : ポスターセッション)
- 一般化固有値展開を用いたセミブラインド音源分離
- 1.仮想状況と現実状況における食事メニュー嗜好の差異について(一般セッション 認知・情報)
- 学習するジャムセッションシステム : 演奏者固有のフレーズの獲得(セッション5 : 自動演奏システム)
- 発音時刻の楽譜上の位置を確率モデルにより推定するクォンタイズ手法(音楽情報科学)
- 学習に基づくクォンタイズ : 発音時刻の楽譜上の位置の推定
- 2.移動端末におけるユーザの状況を考慮した嗜好抽出技術(実世界上のユーザ行動に着目した嗜好抽出・情報推薦, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- 変分ベイズ法を用いたモデル構造探索に基づく抽象的単語の学習(人工知能,認知科学)
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習(テーマ関連セッション1)
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習
- ベイジアンネットワークモデルの構造学習におけるMDL規準の改善提案
- ベイジアンネットによる映画コンテンツ推薦方式の検討(好みの計量)
- 映画コンテンツ推薦のためのユーザ嗜好性モデルの実験的評価
- ヒューマノイドロボットにおける音響シミュレーションの検討
- 視聴覚センサ情報の統合による音源追跡
- マイクロホンアレイとカメラアレイを用いた会議録コンテンツ作成システムについて
- ロボットにおける音源位置推定(ロボットにおける音響技術)
- 多人数インタラクションの工学的応用 : 認識・理解システムの構築とその利用について(ワークショップ,言語・非言語コミュニケーション及び一般)
- ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(システム論文特集号)
- パーティクルフィルタを用いた移動音源の追跡技術
- マイクロホンアレイと音源定位を用いた会議録再生システムについて(立体音響・音場制御/聴覚/一般)
- ひずみ感と帯域感を考慮した楽音符号化方式の最適品質設計法(ネットワーク)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
- EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
- 音を分ける
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 「ニューロラルな視点からの挑戦」へのコメントと回答
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習(テーマセッション(1),CVのためのパターン認識・学習理論の新展開)
- D-9-8 携帯電話上での行動予測モデルに関する検討(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
- 視覚情報から言語表現を生成するシステムの試作
- 少し離れたところから
- 知的であるとはどういうことか?
- インタラクションを通じた学習
- マイクロフォンアレイを用いた音環境の見守りによる非日常音と危険状態の検出システム(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- 階層ベイズモデルによる協調フィルタリング(一般講演(モデルとデータの統合),機械学習とその応用)
- Q&Aコーナー(コーヒーブレーク)
- コヒーレントサブスペース法を用いたアレイ信号処理による音声強調
- 映画コンテンツ推薦のためのユーザ嗜好性モデルの実験的評価
- 想定状況と現実状況における食事メニュー嗜好の差異の分析(一般,生物模倣情報処理,機械学習,一般)
- 1.座談会 ニューロコンピューティング研究から生まれたもの(ニューロコンピューティング研究の歴史とその将来)
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成を用いた文章発話に対する音声区間検出の検討
- 疎な位置情報履歴からの有意位置抽出方式に関する検討(IBIS2010(情報論的学習理論ワークショップ))
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 環境音モデルとHMM合成を用いた音声区間検出法の音声認識への適用
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法(マルチメディア通信とQoS, VoIP, ストリーミング, 一般)
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法
- 2.ニューロコンピューティング研究から生まれたもの : 理論・応用的側面(ニューロコンピューティング研究の歴史とその将来)
- ニューロコンピューティング研究から生まれたもの : 理論・応用的側面
- 音響情報と画像情報の統合による発話区間検出 : 基本的なコンセプト
- 話者位置推定のためのベイジアンネットによる音響情報と画像情報の統合
- SVMを用いた音源数推定の音源分離システムへの応用
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 音源分離におけるSVMを用いた音源数推定法について
- 音源分離におけるSVMを用いた音源数推定法について
- Kirchhoff-Helmholtz 積分方程式に着目した状態フィードバック制御による反射音抑圧手法の提案
- ブラインド信号分離における音源数推定法について
- 符号化音声の客観品質評価に用いる擬似音声の有効性
- 残留エコー特性の客観測定に用いるテスト信号の比較
- 楽音波形の折れ線近似に基づくVariable bit-rate符号化の一検討
- 帯域とビットレートを考慮した楽音符号化品質設計法
- 3. ICAによる音響信号の分離(見分ける,聞き分ける)
- 実音響環境における音響シーンデータの収集
- D-14-36 RWCP実環境音声・音響データベース
- 実環境における音響シーンデータベースの構築
- 自然言語処理の基礎, 奥村学(著), コロナ社, 2010-10, A5判, 定価(本体2,100円+税)
- 一般化固有値展開を用いたセミブラインド音源分離
- 反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
- 反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
- 楽音波形の折れ線近似 Variable bit-rate 符号化方式の適応量子化による品質改善
- D-20-1 通信履歴からの有意位置抽出方式の実験的評価(D-20.情報論的学習理論と機械学習,一般セッション)
- 情報・コンテンツのレコメンド技術と課題
- 高次Cumulantを用いたアレイ信号処理
- 近頃, 思うこと
- サブスペース法に基づいたアレイ信号処理による音声強調手法
- 分割構造を持つGriffiths-Jim型適応ビームフォーマについて
- RLS適応ビームフォーマの実装に関する検討
- 音響入門シリーズ A-1音響学入門, 日本音響学会(編), 鈴木陽一,赤木正人,伊藤彰則,佐藤洋,苣木禎史,中村健太郎(共著), コロナ社, 2011-03, A5判, 定価(本体3,200円+税)
- 階層ベイズモデルによるモデル適応(一般及び雑音を有効利用する神経系やそのモデル)
- 階層ベイズモデルによるモデル適応(一般及び雑音を有効利用する神経系やそのモデル)
- 携帯電話通信時に得られる疎な位置情報履歴を用いた有意位置検出(データマイニング,ライフログ処理技術とその活用システム論文)