ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(第8回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
音声対話システムにおいて,ユーザの多様な発話を頑健に認識するためには,タスクドメインに合致した十分な量のテキストデータでN-gram言語モデルを学習することが望ましい.しかし,新たに音声対話システムを作成する際に,ユーザが入力すると想定される発話を大量に用意することは困難である.そこで本研究では, Webから学習データを収集・選択することにより効率的に言語モデルを構築する手法を提案する. Webの検索クエリは,対話システムが対象とするドメインについて記述された文書から作成して, Webを検索する.このようにして収集されたWebテキストの多くは,対話システムのユーザの発話スタイルとマッチしたものではなく,言語モデルの学習データとしてこれらのすべてを使用するのは適切でない.そこで,別の対話システムで収集されたユーザ発話コーパスを併用することで,発話スタイルの近い文を選択する.ソフトウェアサポートと観光案内の2つのドメインにおいて評価を行った結果,音声認識精度の有意な改善が得られた.また実験結果の分析により, Webテキストを選択する際に,テキストのスタイルを考慮することの重要性が確認された.
- 一般社団法人情報処理学会の論文
- 2006-12-21
著者
関連論文
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
- フレーズスポッティングと意味解析の密結合による頑健な音声言語理解
- 音声理解システムにおける制約緩和法の検討
- 会議音声の自動話題分割による単語辞書と言語モデルの適応(要約・分割)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- ポッドキャストを対象とした音リアクションイベント検出
- 【パネル討論】音声インタフェースにおけるWebテキスト処理技術の利用
- 【パネル討論】音声インタフェースにおけるWebテキスト処理技術の利用
- 3L-3 大規模文書を知識ベースとする音声対話システム(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 質問応答・情報推薦機能を備えた音声による情報案内システム(音声質問応答,インタラクションの理解とデザイン)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- ドメインとスタイルを考慮したWebテキストの選択による音声対話システム用言語モデルの構築(音声,聴覚)
- 文書検索型音声対話システムにおけるベイズリスクに基づく対話制御の最適化(セッション3 : 理解るインタフェース : 音声対話)
- 文書検索型音声対話システムにおけるベイズリスクに基づく対話制御の最適化(セッション3 : 理解るインタフェース : 音声対話)
- 音声対話システムにおける対話相手・発話意図と発話タイミングの関係の分析
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(第8回音声言語シンポジウム)
- ドメインとスタイルを考慮した Web テキストの選択による対話システム用言語モデルの構築
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(Session-7 システム,第8回音声言語シンポジウム)
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(Session-7 システム,第8回音声言語シンポジウム)
- ドメインとスタイルを考慮した Web テキストの選択による対話システム用言語モデルの構築
- 限定されたドメインにおける質問応答機能を備えた文書検索・提示型対話システム(検索・対話)
- 質問応答技術を利用したインタラクティブな音声対話システム
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- 点予測による形態素解析
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 隣接文節間の係り受け情報に着目した話し言葉のチャンキングの評価
- 視覚情報を話題の対象とする音声対話システム
- 視覚情報を話題の対象とする音声対話システム
- 音声版ダイアログナビ : 音声対話によるソフトウェアサポート(音声対話システムB)(テーマ:音声対話システム、音声言語情報処理、一般)
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- 音声対話によるソフトウェアサポートタスクのための確認戦略
- 2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
- VoiceXMLの動的生成に基づく自然言語音声対話システム
- VoiceXMLの動的生成に基づく自然言語音声対話システム
- 講義の自動アーカイブ化のための韻律情報を用いた講義音声の文境界の抽出
- 日本語モーラリズム習得支援システム : 調音法に基づいたリズムパターンテンプレートの設定
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 音声による大規模知識ベース検索のための単語重要度を考慮したベイズリスク最小化デコーディング
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 音声対話によるソフトウェアサポートタスクのための効率的な確認戦略(音声, 聴覚)
- 音声インタフェースにおける Web テキスト処理技術の利用
- 音声言語を用いた仮想空間との対話による試着システム
- 話題と話者に関するPLSAに基づく言語モデル適応(言語モデル・要約)(第5回音声言語シンポジウム)
- Web からの情報抽出を用いた音声対話システム
- 文書検索タスクにおける検索要求明確化のための対話戦略
- 文書検索タスクにおける検索要求明確化のための対話戦略
- 音声対話理解のためのネットワーク上のMessage Passingに基づく部分文解析
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習(音声,聴覚)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
- 講演音声認識のための言語モデルの教師なし適応
- LPC残差のキュムラントとオンラインEMアルゴリズムに基づいた頑健な発話区間検出(認識・検出)
- 講演音声認識のための言語モデルの教師なし適応
- 対話コンテキストとトピッククラスタリングを用いたドメイン外発話の検出
- 述語項の類似度に基づく情報推薦を行う音声対話システム
- ウエーブレットに基づくウイナーフィルタを用いた雑音及び残響に頑健な音声認識
- 識別学習に基づく音声認識単語辞書の最適化
- 講演に対する読点の複数アノテーションに基づく自動挿入
- テキストと音声を用いた単語と読みの自動獲得
- 複数トピック分類の信頼度に基づくドメイン外発話の検出(システム・信頼度)(第5回音声言語シンポジウム)
- 複数トピック分類の信頼度に基づくドメイン外発話の検出
- right-to-leftパーザを用いた会話音声認識
- ポスター発表における質問者と質問の種類の推定のためのマルチモーダルな聞き手行動分析
- Web時代の音声・言語技術
- 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム
- 音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出
- BICに基づく話者モデル選択の教師なし話者インデキシングにおける評価
- 点予測による形態素解析
- 情報コンシェルジェ : Mind Probingに基づくマルチモーダルインタラクションシステム(「コミュニケーションと気づき」及び一般)
- 複合的言語制約に基づくキーフレーズスポッティングによる対話音声理解
- 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
- ウエーブレットパケット分解による残響に頑健な音声認識
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(システム・信頼度)(第5回音声言語シンポジウム)
- ポスター会話におけるパラ言語・非言語情報を用いた話者交替及び次話者の予測 (一般セッションと「法と社会のインタフェース」関する特別セッション)
- 話題の追跡 国会審議の会議録作成支援のための音声認識システム
- 議会の会議録作成のための音声認識-衆議院のシステムの概要-
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 識別学習に基づく音声認識単語辞書の最適化の評価(言語モデル・辞書,第13回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応(音声,聴覚)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識(言語モデル・辞書,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声認識技術を用いた講演・講義への字幕付与
- 単語N-gramと段階的探索を用いた大語彙連続音声認識
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識
- 識別学習に基づく音声認識単語辞書の最適化の評価
- 4. 音声認識技術を用いた講演・講義への字幕付与(教育におけるICTと映像情報の活用)
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識
- 識別学習に基づく音声認識単語辞書の最適化の評価
- スマートポスターボード : ポスター会話のマルチモーダルなセンシングと認識(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)