大規模コーパスへのクラス付与に基づく音声対話システム用言語モデルの構築
スポンサーリンク
概要
- 論文の詳細を見る
音声対話システムでは地名などの固有名詞(内容語)の認識が重要である.本研究では,これをクラスとしたクラスN-gramモデルの自動作成を行う.これにはクラスが多数付与された大規模コーパスが必要であるが,個別の音声対話システムのドメインにおいて大規模コーパスの存在を仮定するのは現実的ではない.そこで我々は,類似ドメインの大規模コーパスを用い,その中で,検索対象データベース中の内容語と一致する部分を種とした機械学習を行うことで,徐々にクラス付与箇所を増加させるというアプローチを採る.これにより,内容語周辺の多様な発話パターンを認識可能な言語モデルの構築を目指す.評価実験により,提案する枠組みにより,内容語の認識率が向上する可能性を示す.
- 2012-07-12
著者
-
佐藤 理史
名古屋大学大学院工学研究科
-
駒谷 和範
名古屋大学大学院 工学研究科 電子情報システム専攻
-
駒谷 和範
名古屋大学大学院工学研究科
-
森祥 二郎
名古屋大学大学院工学研究科
-
駒谷 和範
名古屋大学
-
佐藤 理史
名古屋大学大学院 工学研究科 電子情報システム専攻
関連論文
- 複数の言語モデルと言語理解モデルによる音声理解の高精度化(音声認識・理解,情報爆発論文)
- 人工神経回路モデルと声道物理モデルを用いた母音模倣モデルに基づく音素獲得シミュレーション
- 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚
- 後続ひらがな列に基づく語の活用型推定(語彙知識)
- 述語句統語的異形間の言い換えらしさの計算手法(述語/動詞の言い換えとクラスタリング・分析)
- チュートリアル&パネル 対話システム研究の進め方
- 発話行為レベルの情報を活用した音声対話システムの研究
- テルミンの音高・音量特性のモデルに基づくテルミン演奏ロボットの開発
- 多重奏音響信号中の演奏をユーザー指定の旋律に差し替えるフレーズ置換システム
- バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用
- SpeakBySinging: 歌声を話声に変換する話声合成システム
- 複数の言語モデルと言語理解モデルによるラピッドプロトタイピング向け音声理解
- 日本語機能表現の自動検出と統計的係り受け解析への応用
- 機能表現を考慮した統計的日本語係り受け解析(解析・対話)
- 機能表現を考慮した統計的日本語係り受け解析
- 機械学習を用いた日本語機能表現のチャンキング
- 日本語複合辞用例データベースの作成と分析(自然言語,情報処理技術のフロンティア)
- バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用
- 後続ひらがな列に基づく語の活用型推定(語彙知識)
- 現代日本語書き言葉均衡コーパスに対する難易度付与(テキスト評価とリーダビリティ)
- 基本慣用句五種対照表の作成(言語資源・文書分析)
- 6T-7 Robot Musical Accompaniment : Real-time Synchronization using Visual Cue Recognition
- 6T-8 複数自由度を用いて音高特性モデルに基づく音高制御を行うテルミン演奏ロボットの開発(音楽推薦・演奏支援,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- エッセイコーパスを用いた日本語テキストの著者推定
- 単に感情を表出する発話(編集委員今年の抱負2011)
- 文体と難易度を制御可能な日本語機能表現の言い換え
- 日本語機能表現辞書の編纂
- 機能表現「なら」の機械翻訳のための言い換え(言い換え,文法)
- 機械学習を用いた日本語複合辞のチャンキング(抽出, 言い換え)
- 3U-2 複数の言語モデルと言語理解モデルによる音声理解手法のラピッドプロトタイピングへの適用(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 関連用語収集問題とその解法
- ウェブを利用した関連用語の自動収集
- 6J-6 楽器音イコライザによる楽曲音響特徴変動と類似楽曲検索への応用(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- ウェブから収集した専門分野コーパスと要素合成法を用いた専門用語訳語推定
- ウェブを利用した専門用語の分野判定(自然言語処理)
- 5T-5 調波非調波GMMに基づくMIDI演奏音響信号に対する音色・演奏表情操作(音楽信号処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 自動検出のための慣用句の分類と語彙的情報(語と慣用句)
- 音韻論的・形態論的制約を用いたモンゴル語句生成・形態素解析
- 質問文中のキーワードと解候補の連想の強さを用いた解の決定
- 音韻論的・形態論的制約を用いたモンゴル語形態素解析(解析)
- 音韻論的・形態論的制約を用いたモンゴル語形態素解析(解析)
- 音韻論的・形態論的制約を用いたモンゴル語句生成(機械翻訳)
- 日英二言語文書を用いた訳語対応推定 : ウェブ上の非対訳文書を用いた訳語候補順位付け(情報抽出・翻訳知識獲得)
- 用例ベース翻訳のための対訳文の句アライメント
- 用例ベース翻訳のためのパラレルコーパスからの対訳対発見
- ワールドワイドウェブを利用した角語説明の自動生成(システムLSIの設計技術と設計自動化)
- 5V-6 RNNを用いた行為予測による人間とロボットの協調物体配置(人工知能一般(4),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 6U-1 F0・振幅・音韻長の制御により歌声を話声に変換する話声合成システムSpeakBySinging(音声・歌声合成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 6J-8 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6J-7 ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 1ZN-2 Score Following by Particle Filtering for Music Robots
- 2ZN-2 バージイン許容音声対話におけるLSMによる許容発話範囲の拡張(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 自然言語処理 特集号「言い換え」
- 6W-8 MTRNNを用いた単語と文法の階層的自己組織化による文の認識・生成(構文解析・生成・学習,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5U-9 ユーザの文法知識を状態に加えたPOMDPに基づく音声対話システム(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3U-9 環境音から擬音語への自動変換における特徴量抽出法の検討(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3U-7 スペクトル推定を用いたマイク数以上の同時発話に対する音声認識(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3T-1 クラシック音楽理解力拡張インタフェースを目指して : 複数の演奏家による解釈共通旋律と解釈相違旋律の推定(音楽情報の推定と理論,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 地域情報ウェブディレクトリの自動編集
- RE-003 「意外や意外」回文だ : 文章中に知られざる回文はあるか(E分野:自然言語・音声・音楽,査読付き論文)
- とれないeqをどうとるか(編集委員2007年の抱負)
- 4択クイズを連想問題として解く(検索・多義性解消)
- 境界認定の提案 : (2)背景と思想(解析)
- 境界認定の提案 : (1)コンセプトと実現法(解析)
- 境界認定の提案 : (2)背景と思想(解析)
- 境界認定の提案 : (1)コンセプトと実現法(解析)
- 異表記同語認定のための辞書編纂(解析)
- 格フレームの対応付けに基づく用言の言い換え
- 日本語文の規格化
- 辞書定義文の圧縮による定義表現パターンの発見
- 日本語クロスワードパズルを解く
- 国語辞典に基づく平易文へのパラフレーズ
- 発語行為レベルの情報を用いた音声対話システムの構築とデータ分析
- 検索連動型広告の自動生成と集客効果の測定-飲食店ドメインを例題に
- ベース音高と和音特徴の統合に基づく和音系列認識
- 均衡コーパスを規範とするテキスト難易度測定
- ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク
- ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク
- Target Speech Detection and Separation for Communication with Humanoid Robots in Noisy Home Environments
- Self-organization of Dynamic Object Features Based on Bidirectional Training
- いま日本語に起こっていること
- Selecting Help Messages by Using Robust Grammar Verification for Handling Out-of-Grammar Utterances in Spoken Dialogue Systems
- 音声対話システムにおける 簡略表現認識のための自動語彙拡張
- フレーズ置換のための調波非調波GMM・NMFに基づく音源分離・演奏合成
- 発語行為レベルの情報をユーザ発話の解釈に用いる音声対話システム
- 音声対話システムにおける発話区間検出結果の音声認識性能への影響の調査 (第二回対話システムシンポジウム 一般セッションと対話システム)
- 大規模コーパスへのクラス付与に基づく音声対話システム用言語モデルの構築
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK(オーガナイズドセッション:音声対話,第13回音声言語シンポジウム)
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK(オーガナイズドセッション:音声対話,第13回音声言語シンポジウム)
- 音声対話システムにおける暗黙的な教師信号に基づく音声認識率の推定とそれを用いたエラー予測
- 複数人会話におけるロボットによる視聴覚情報に基づくアクティブユーザの推定
- 複数人会話におけるロボットによる視聴覚情報に基づくアクティブユーザの推定
- 音声対話システム用クラスN-gramモデルによるドメイン固有語の認識率向上
- 音声対話システム用クラスN-gramモデルによるドメイン固有語の認識率向上
- 検索連動型広告の自動生成と集客効果の測定 : 飲食店ドメインを例題に
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK
- 特集「音声対話システムの実用化に向けて」にあたって
- 人間のようなターンテイキング(編集委員今年の抱負2013)
- センター試験『国語』現代文の傍線部問題を解くベースライン法
- RF-009 文節データベースを用いた日本語アナグラムの自動生成(複雑系及び一般,F分野:人工知能・ゲーム)