確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,大域的な文脈をモデル化する確率的LSA(Probabilistic Latent Semantic Analysis: PLSA)を利用した統計的言語モデルに注目し,このモデルを未知の文脈に適応させう方法を検討する.従来の適応方法は,モデルを作成するときと同じ最尤推定(EMアルゴリズム)をそのまま使うものであるが,未知の文脈に動的に適応させる場合は使える文脈は少量であり,過適応を起しやすい.本報告では一般に過適応しにくいと言われているベイズ学習(変分ベイズ学習)を用いた適応手法を検討し,unigramとtrigramモデルのtest-set perplexityを使って比較評価した.結果として,PLSAが得意とする中頻度語彙に対しては,特に適応に使える文脈の量が少ない場合,ベイズ学習を用いた適応がEM適応よりも安定して高性能であることを確認した.高い出現頻度を持つ語彙を含む場合は,EM適応の方が高い混合教のときunigramモデルで優位であったが,trigramモデルではベイズ適応が優位であった.
- 一般社団法人情報処理学会の論文
- 2002-12-19
著者
-
山本 幹雄
筑波大学大学院システム情報工学研究科
-
山本 幹雄
沖テクノシステムズラボラトリ(株)
-
三品 拓也
日本アイ・ビー・エム株式会社東京基礎研究所
-
三品 拓也
筑波大学 理工学研究科
-
山本 幹雄
筑波大学 電子・情報工学系
-
山本 幹雄
豊橋技術科学大学情報工学系中川研究室
関連論文
- トピック教師なしデータからのトピック依存評価表現モデルの獲得(「主観表現処理の最前線」シンポジウム)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定(自然言語処理)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 統計的機械翻訳におけるフレーズ対応最適化を利用したN-best翻訳候補のリランキング
- 確立・統計的言語モデル (特集 脳とことばとコンピュータ--脳の高次機能の解明に向けて)
- 確率・統計情報を用いた文法研究 (新・文法用語入門) -- (新しい文法研究)
- 日本語音声コ-パスの比較・選択の方法
- 6U-2 特許文に対するクロストリガーモデルを用いた統計的機械翻訳システム(自然言語処理,学生セッション,人工知能と認知科学)
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して(文書分類・翻訳)
- 音声認識セミナー : 基礎からディクテーションまで
- コーパスから抽出された辞書を用いた表記誤り検出法
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果パラメータのパタン化
- 声帯振動の非線形効果を考慮した合成音声とその評価
- 音声対話データベース構築の現状(音声対話システムの実力と課題)
- ブログ記事集合を用いたポストとコメントとの自動分離抽出手法の提案
- 方言音声コーパスの設計・構築と分析
- 日本語方言音声コーパスの構築と分析
- Integer programming for a phrase alignment problem on statistical machine translation (21世紀の数理計画--最適化モデルとアルゴリズム--RIMS研究集会報告集)
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 日本語ディクテーションのための言語資源・ツールの整備
- 日本語ディクテーションのための言語資源・ツールの整備
- 2000-FI-59-2 / 2000-DD-24-2 情報検索性能と表記の揺れへの寛容性を持つ類似度
- 2000-FI-59-2 / 2000-DD-24-2 情報検索性能と表記の揺れへの寛容性を持つ類似度
- 2000-NL-138-9 ダイナミックプログラミングでの検索方法
- NLC2000-18 ダイナミックプログラミングでの検索方法
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 97年度版
- 日本語ディクテーション基本ソフトウェア(97年度版)
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 対訳特許文書からの専門用語対訳辞書半自動獲得におけるフレーズテーブルと既存対訳辞書の併用(機械翻訳・要約・評判分析)
- 3D-5 フレーズテーブルと要素合成法を用いた対訳特許文書からの専門用語対訳辞書生成(自然言語処理,一般セッション,人工知能と認知科学)
- 語学会話教育用ICAIシステムの構成
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- 日本語音声コーパスの比較・選択の方法
- 日本音響学会新聞記事読み上げ音声コーパスからの評価用発話セットの作成
- 人間の理解手法を用いたロバストな音声対話システム
- ロバストな対話システム構築に関する一考察
- 音声対話システムにおける自然発話の頑健な一理解法
- 事前説明によるシステムへの入力発話の変化と誤認識結果の人間による復元
- 事前説明によるシステムへの入力発話の変化と誤認識結果の人間による復元
- 自然発話の意味理解と対話システム
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 音声対話文における助詞落ち・倒置の分析と解析手法
- 音声対話とキーボード対話における発話文の統語的特徴の比較
- 混合ディリクレ分布を用いたトピックに基づく言語モデル(音声, 聴覚)
- 確率的LSAを用いた日本語同音異義語誤りの検出・訂正(自然言語)
- 確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化(音声,聴覚)
- 混合ディレクレ分布を用いた文脈のモデル化と言語モデルへの応用
- 確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化
- 確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化
- 確率的LSAに基づくngramモデルの変分ベイズ学習を利用した文脈適応化
- 生成文書モデルを用いた文書読み上げ音声認識(認識, 信頼度)
- GMMによる多言語音声系統樹の構成
- 文書確率を用いた文書読み上げ音声認識
- F_0モデルパラメータ自動抽出方法の改良(聴覚・音声・言語とその障害, 一般)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- 混合ガウス分布による多言語音声系統樹の構成(音声言語応用)(第6回音声言語シンポジウム)
- F_0モデル・パラメーターの自動決定方法についての考察(ポスターセッション)(第5回音声言語シンポジウム)
- F_0モデル・パラメーターの自動決定方法についての考察(第5回音声言語シンポジウム : ポスターセッション)
- F_0モデル・パラメーターの自動決定方法についての考察(第5回音声言語シンポジウム : ポスターセッション)
- F_0モデル・パラメーターの自動決定方法についての考察
- F_0モデルパラメータ自動決定の一方法
- 国内における音声データベースの現状 : 開発,管理及び音声研究への利用
- F_0モデルパラメータ自動抽出の一方法
- F_0モデルパラメータ自動抽出の一方法
- 音声による対話システムの評価法における一考察
- 多言語音声コーパスの構築と分析
- 韻律情報を考慮した音声要約の一方法
- 混合ディリクレ分布パラメータの階層ベイズモデルを用いたスムージング法(音声言語情報処理一般)(テーマ:音声対話システム、音声言語情報処理、一般)
- 英日統計的機械翻訳における語順優先探索デコーダ(自然言語)
- 教師情報を必要としないニュースページ群からのコンテンツ自動抽出
- 大語彙連続音勢認識研究用日本語コーパス : JNAS
- メニューによりガイドされた文節単位発声による音声対話システム
- メニューに基づく音声対話システムとその評価
- 文献検索タスクを用いた音声対話データの収録と分析
- 文献検索をタスクとした音声対話コーパスの構築と分析
- 文献検索をタスクとした音声対話データの収録と分析 (テーマ:コーパスを利用した談話・対話研究)
- 韻律情報を用いた発話文タイプ付与支援システム
- 表層情報を用いた統計的手法による発話文の自動分類
- 表層情報を用いた数量化理論第III類による発話文の分類と分析
- 例文からの話し言葉用文法の半自動修正法
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定
- 評価表現と文脈一貫性を利用した教師データ自動獲得によるクレーム文検知(第3回集合知シンポジウム)
- メニュー入力を用いた日本語作文学習システム
- 日本語学習者向け日本語スペルチェッカ
- E-034 レビュー集合要約における特徴的評価視点セレクション(感情・評判,E分野:自然言語・音声・音楽)
- ブログページ集合からのポストおよびコメント自動分離抽出手法