階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング

概要

論文の詳細を見る
2012-03-05

著者

中村篤
Nttコミュニケーション基礎科学研究所
小川哲司
早稲田大学
小林哲則
早稲田大学
俵直弘
早稲田大学
渡部晋治
Mitsubishi Electric Research Laboratories

関連論文

オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
「共感覚者の驚くべき日常」, リチャードE. シトーウィック著, 山下篤子訳, 草思社, 2002年(私のすすめるこの一冊)
会話ロボットとその聴覚機能
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
シャッタが切り取る世界(ちょっとしたエッセイ,コーヒーブレーク)
アンサンブル型最小分類誤り学習法の実装と実験的評価(一般セッション,CV・パターン認識のための学習・最適化)
アンサンブル型最小分類誤り学習の提案(テーマ関連セッション2,コンピュータビジョンとパターン認識のための学習理論)
アンサンブル型最小分類誤り学習の提案(テーマ関連セッション2)
ロボットのためのハンズフリー音声認識システム(音響処理・話者同定,第10回音声言語シンポジウム)
プロキシエージェントアーキテクチャによる音声認識アプリケーション用ユーザモニタリング機能の効率化(セッション2 : 理解るインタフェース : 音声+ソーシャル+コミュニティ)
対話ロボットの動作に頑健な頭部ジェスチャ認識(画像認識,コンピュータビジョン)
正方形マイクロホンアレイによる音源分離技術 (特集音声認識技術の実用化への取り組み)
音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
カルマンフィルタによる音声認識のための特徴量トラジェクトリ生成法
ベイズ的基準を用いた状態共有型HMM構造の選択
変分ベイズ法の音響モデル適応への応用
ベイズ的アプローチに基づく状態共有型HMM構造の学習
静的特徴量時系列と動的特徴量時系列の関係を用いたトラジェクトリパラメータ生成による音声認識手法
実対話音声を用いた有限状態トフンスデューサ型認識デコーダの評価
有限状態変換器で定義される任意の音声認識タスクのための時間同期ビタービデコーダ
4 正方形マイクロホンアレイによる音源分離技術(音声認識技術の実用化への取り組み)
最大幾何マージン最小分類誤り学習法を目指して
判別関数の一般形に対する幾何マージンの導出とその制御を伴う最小分類誤り学習(テーマセッション,CV・パターン認識のための学習・最適化)
最小分類誤り学習における幾何マージンの制御法について(音響モデル,認識,理解,対話,一般)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
マルチカーネル学習を用いた話者認識における最適化の検討
B-8-59 停電時上り音声通信を実現する光アクセス方式の提案(B-8.通信方式,一般セッション)
最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識
サーチエラーリスク最小化に基づくViterbiビーム探索とその評価 (音声)
サーチエラーリスク最小化に基づくViterbiビーム探索とその評価 (言語理解とコミュニケーション)
複数音響環境の発話単位遷移モデルに基づく適応学習法の検討(認識,理解,対話,一般)
識別的誤り訂正学習における対立単語列と素性の選定(特徴量・音響モデル,第9回音声言語シンポジウム)
巨視的な時間発展系に基づく逐次モデル適応 : モデルの逐次更新における学習データの発話数に関する考察(一般(ポスターセッション),第9回音声言語シンポジウム)
識別的誤り訂正学習における対立単語列と素性の選定(特徴量・音響モデル,第9回音声言語シンポジウム)
巨視的な時間発展系に基づく逐次モデル適応 : モデルの逐次更新における学習データの発話数に関する考察(一般(ポスターセッション),第9回音声言語シンポジウム)
識別的誤り訂正学習における対立単語列と素性の選定(特徴量・音響モデル,第9回音声言語シンポジウム)
巨視的な時間発展系に基づく逐次モデル適応 : モデルの逐次更新における学習データの発話数に関する考察(一般(ポスターセッション),第9回音声言語シンポジウム)
ロボットのためのハンズフリー音声認識システム(音響処理・話者同定,第10回音声言語シンポジウム)
ロボットのためのハンズフリー音声認識システム(音響処理・話者同定,第10回音声言語シンポジウム)
プロキシエージェントアーキテクチャによる音声認識アプリケーション用ユーザモニタリング機能の効率化(セッション2 : 理解るインタフェース : 音声+ソーシャル+コミュニティ)
最小相対エントロピー識別学習へのラティスによる仮説表現と並列化可能な最適化手法の導入
サーチエラーリスク最小化に基づくViterbiビーム探索とその評価(デコーダ,第11回音声言語シンポジウム)
サーチエラーリスク最小化に基づくViterbiビーム探索とその評価(デコーダ,第11回音声言語シンポジウム)
最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識
HMMの尤度パターンを利用したリスコアリングにおける次元圧縮法の検討(認識,理解,対話,一般)
マクロな時間構造を持つテンプレート群からの確率的距離を用いた階層型音声認識(認識,理解,対話,一般)
特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合(第8回音声言語シンポジウム)
特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合
特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合
特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合
減算型アレイ処理とスペクトラルサブトラクションを用いた音源分離技術とその携帯電話への応用(認識・理解・対話・一般)
シミュレーションに基づく音声認識システム評価の妥当性の検証(認識・理解・対話・一般)
マイク間のスペクトル強度比を利用した音源定位におけるHLDA利用の効果(耐雑音, 音源分離, ロボット)
参照信号によるパーミュテーション問題解決とSMDPの統合による周波数領域BSSの性能向上(耐雑音, 音源分離, ロボット)
音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
5T-4 調波GMMとWienerフィルタに基づく音楽音響信号の残響抑圧(音楽信号処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
B-8-11 停電時上り音声通信光アクセス方式の実現技術の検討(B-8.通信方式,一般セッション)
最小識別誤り学習と重み付き有限状態トランスデューサによる大語彙音声認識
確率主成分分析を用いた音声認識の日本語話し言葉コーパスにおける評価
混成主成分分析を用いた音声認識(ポスターセッション)
混合主成分分析を用いた音声認識
混合主成分分析を用いた音声認識(ポスターセッション)
混合主成分分析を用いた音声認識(ポスターセッション)
ベイズ的基準を用いた状態共有型HMM構造の選択
ベイズ的基準を用いた状態共有型HMM構造の選択
次世代の音声認識技術 (特集コミュニケーションの壁を克服するための音声・音響処理技術)
ベイズ的アプローチに基づく状態共有型HMM構造の学習
識別的基準と遺伝的アルゴリズムに基づく部分隠れマルコフモデルの構造の最適化(多言語, CSJ, 認識・理解・対話・一般)
混合主成分分析を用いた音声認識
ベイズ的音声認識VBECを用いたモデル構造自動構築法の多様な音声デｰタに対する頑健性
ベイズ的音声認識VBECを用いたモデル構造自動構築法の多様な音声データに対する頑健性(ポスターセッション)
ベイズ的音声認識VBECを用いたモデル構造自動構築法の多様な音声データに対する頑健性(ポスターセッション)
次世代音声認識のための音響モデル : 学習とダイナミクス表現(チュートリアル : 次世代音声認識のための音響モデル)
LG-002 移動ベクトルのコース/ファイン学習法にもとづく音響モデル適応(G. 音声・音楽)
混合主成分分析を用いた音声認識
逐次増加型最小分類誤り学習によるパターン認識(パターン認識)
学生/教養のページ音声認識における識別学習
音声認識における識別学習(学生/教養のページ)
幾何マージンに基づく誤分類尺度を用いた最小分類誤り学習法(パターン認識)
ATRの会話音声翻訳研究用データベース(音声研究関連データベースの動向)
劣決定音源分離のための分離音声のケプストラムスムージング
Deep Learningに基づく音声特徴量の有限状態トランスデューサ型識別モデルによる識別 (音声)
音声認識における識別学習
A-10-9 フルランク空間相関行列モデルに基づく拡散性雑音除去(A-10.応用音響,一般セッション)
周波数依存の時間差モデルによる劣決定BSS
階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング(ベイズ統計モデル,統計推理,データベース,一般)
周波数依存の時間差モデルによる劣決定BSS
複数人会話シーン分析の研究と今後の展望(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)
Deep Learningに基づく音声特徴量の有限状態トランスデューサ型識別モデルによる識別(高精度音声認識,認識,理解,対話,一般)
階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング
周波数依存到来時間差推定に基づく劣決定ブラインド音源分離の高速化

階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング

スポンサーリンク

概要

著者

関連論文

スポンサーリンク