話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,話題の連続/不連続変化を考慮したトピックモデルを提案し,MIT講義音声コーパスを用いて行った評価実験について述べる.実環境においては,話者交代や話し方,話題の変化などにより音響的・言語的特徴が時々刻々と変化する.このような変化に対応するため,発話単位で環境適応を行う逐次追従型音声認識が注目されている.本研究では,言語的な変化に着目し,話題の連続的な変化を考慮するモデルとしてOnline Topic Modelを用いた言語モデル適応,及び話題の不連続な変化を考慮するモデルとしてTopic HMMを用いた言語モデル適応を提案する.評価実験により,これらのトピックモデルを用いることで単語誤り率(WER)を改善出来ることを確認した.また,刻々と変化する話題を追跡することで,認識結果全体を用いた言語モデルのバッチ適応よりも良好な結果を得ることが出来た.
- 一般社団法人情報処理学会の論文
- 2008-12-02
著者
-
岩田 具治
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
渡部 晋治
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
有木 康雄
神戸大学大学院自然科学研究科
-
岩田 具治
NTTコミュニケーション科学基礎研究所
-
堀 貴明
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
堀 貴明
Nttコミュニケーション科学基礎研究所
-
佐古 淳
神戸大学大学院自然科学研究科
-
有木 康雄
神戸大学大学院システム情報学研究科
-
佐古 淳
神戸大学大学院工学研究科
-
堀 貴明
日本電信電話(株)
-
渡部 晋治
日本電信電話(株)NTTコミュニケーション科学基礎研究所
関連論文
- 購買行動解析のためのトピック追跡モデル(人工知能,データマイニング)
- スパース性に基づくブラインド音源分離を用いたステレオ入力音声認識(音声,聴覚)
- 顧客生涯価値を高めるためのリコメンデーション法(一般セッション,データ工学とメディア理解との融合)
- 顧客生涯価値を高めるためのリコメンデーション法(一般セッション,データ工学とメディア理解との融合)
- 購買順序を考慮した協調フィルタリング(「自動化:推論,発見,学習,データマイニング」及び一般)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦 (ライフインテリジェンスとオフィス情報システム)
- アンサンブル型最小分類誤り学習法の実装と実験的評価(一般セッション,CV・パターン認識のための学習・最適化)
- アンサンブル型最小分類誤り学習の提案(テーマ関連セッション2,コンピュータビジョンとパターン認識のための学習理論)
- アンサンブル型最小分類誤り学習の提案(テーマ関連セッション2)
- スパース性に基づくブラインド音源分離を用いたステレオ入力音声認識
- 分布が変化するデータにおけるモデル学習法(データマイニング)
- スパース性に基づくブラインド音源分離を用いた2チャンネル入力音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討(福祉と音声処理,一般)
- 購買順序を効率的に用いた協調フィルタリング
- 契約期間を延ばすためのレコメンド法
- 契約期間を延ばすためのレコメンド法(セッション1)
- 内容と関連するタグの教師なし抽出(「Webインテリジェンス」及び一般)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- ベイズ的基準を用いた状態共有型HMM構造の選択
- 変分ベイズ法の音響モデル適応への応用
- ベイズ的アプローチに基づく状態共有型HMM構造の学習
- 最大幾何マージン最小分類誤り学習法を目指して
- 判別関数の一般形に対する幾何マージンの導出とその制御を伴う最小分類誤り学習(テーマセッション,CV・パターン認識のための学習・最適化)
- 最小分類誤り学習における幾何マージンの制御法について(音響モデル,認識,理解,対話,一般)
- 混合モデルを用いた異常値の可視化
- K-004 学習者の視点に基づく協調学習履歴の構造化(K分野:教育工学・福祉工学・マルチメディア応用)
- Dirichlet事前分布を用いた音声区間検出の検討
- QAコミュニティにおける複数情報源を用いた効果的な質問推薦
- サーチエラーリスク最小化に基づくViterbiビーム探索とその評価 (音声)
- サーチエラーリスク最小化に基づくViterbiビーム探索とその評価 (言語理解とコミュニケーション)
- 複数音響環境の発話単位遷移モデルに基づく適応学習法の検討(認識,理解,対話,一般)
- 巨視的な時間発展系に基づく逐次モデル適応 : モデルの逐次更新における学習データの発話数に関する考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- 巨視的な時間発展系に基づく逐次モデル適応 : モデルの逐次更新における学習データの発話数に関する考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- 巨視的な時間発展系に基づく逐次モデル適応 : モデルの逐次更新における学習データの発話数に関する考察(一般(ポスターセッション),第9回音声言語シンポジウム)
- 最小相対エントロピー識別学習へのラティスによる仮説表現と並列化可能な最適化手法の導入
- 雑音のバイアス-残差成分の分解と各成分の最適化に基づく雑音抑圧の検討 (音声)
- 雑音のバイアス-残差成分の分解と各成分の最適化に基づく雑音抑圧の検討 (言語理解とコミュニケーション)
- 音声認識における音響モデル(自動音声認識研究の動向と展望)
- Dirichlet事前分布を用いた音声区間検出の検討(韻律・VAD,第11回音声言語シンポジウム)
- サーチエラーリスク最小化に基づくViterbiビーム探索とその評価(デコーダ,第11回音声言語シンポジウム)
- サーチエラーリスク最小化に基づくViterbiビーム探索とその評価(デコーダ,第11回音声言語シンポジウム)
- 音響モデルのベイズ学習
- 最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識
- Dirichlet事前分布を用いた音声区間検出の検討 (音声)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦(不均質なライフログからのデータマイニング及び一般)
- スパース性に基づくブラインド音源分離を用いた2チャンネル入力音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- H-021 ファッション雑誌を用いたコーディネート推薦システム(H分野:画像認識・メディア理解,一般論文)
- ベイズ的基準を用いた状態共有型HMM構造の選択
- ベイズ的基準を用いた状態共有型HMM構造の選択
- ベイズ的アプローチに基づく状態共有型HMM構造の学習
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 動的分散適応に基づく音声強調と音声認識の統合手法の提案(音声認識・識別,第9回音声言語シンポジウム)
- 動的分散適応に基づく音声強調と音声認識の統合手法の提案(音声認識・識別,第9回音声言語シンポジウム)
- 動的分散適応に基づく音声強調と音声認識の統合手法の提案(音声認識・識別,第9回音声言語シンポジウム)
- 複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討(福祉と音声処理,一般)
- ベイズ法による音声認識
- ベイズ的音声認識VBECを用いたモデル構造自動構築法の多様な音声データに対する頑健性
- ベイズ的音声認識VBECを用いたモデル構造自動構築法の多様な音声データに対する頑健性(ポスターセッション)
- ベイズ的音声認識VBECを用いたモデル構造自動構築法の多様な音声データに対する頑健性(ポスターセッション)
- LG-002 移動ベクトルのコース/ファイン学習法にもとづく音響モデル適応(G. 音声・音楽)
- HMM状態-単語の同時確率を用いた音声言語処理のための複雑度指標
- 時間依存関係データ分析のための動的無限関係モデル
- IJCAI-09
- 時間変化に対応する無限関係モデルの提案
- 推薦システム研究を振り返る(平成20年度論文賞の受賞論文紹介)
- トピックモデルに基づく文書群の可視化
- 購買順序を効率的に用いた協調フィルタリング
- 購買順序を効率的に用いた協調フィルタリング
- パラメトリック埋め込み法を用いた分類器の視覚的解析(知識処理,インタラクションの理解とデザイン)
- D-032 最大エントロピー法に基づく推薦システムでのユーザ行動のモデル化(D分野:データベース)
- パラメトリック埋め込み法によるクラス構造の可視化(データマイニング・データウェアハウス)
- パラメトリック埋め込み法によるWeb検索結果のトピック可視化 (特集:「アクティブマイニング」および一般) -- (セッション3 Webマイニング)
- LF-013 事後確率構造の可視化(F. 人工知能)
- 分類の評価や特異文書の検出のための文書群の構造可視化(複数文書の処理)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討 (音声)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討 (信号処理)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討 (応用音響)
- 機械学習に基づく英語穴埋め問題の自動生成 (特集 NTT R&Dのオープンイノベーションをリードする大学連携)
- 逐次増加型最小分類誤り学習によるパターン認識(パターン認識)
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦
- 学生/教養のページ 音声認識における識別学習
- 雑音のバイアス-残差成分の分解と各成分の最適化に基づく雑音抑圧の検討(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 雑音のバイアス-残差成分の分解と各成分の最適化に基づく雑音抑圧の検討(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- ベイズ法を用いた音声認識(チュートリアル : 次世代音声認識のための音響モデル)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- ソーシャルメディアを用いた個人向け旅行プランの自動生成(デジタルドキュメント,ライフログ活用技術,オフィス情報システム,一般)
- 大規模Webクリックデータのためのイベント予測
- 予測尤度最大化に基づく誤分類サンプルの検出(ポスターセッション,第14回情報論的学習理論ワークショップ)
- 行動範囲と興味の同時推定モデルによる地域情報推薦
- 予測尤度最大化に基づく誤分類サンプルの検出
- ユーザの潜在特徴を考慮したソーシャルネットワーク上の情報拡散モデル