複数の言語モデルと言語理解モデルによる音声理解の高精度化(音声認識・理解,<特集>情報爆発論文)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,音声対話システムにおいて,複数の言語モデルと複数の言語理解モデルを用いることで,高精度な音声理解を行う手法について述べる.ユーザの発話によって適した言語モデル・言語理解モデルの組合せは異なることから,単一の音声理解方式で様々な発話に対して高精度な音声理解を実現することは難しい.そこで本論文では,まず,複数の言語モデルと言語理解モデルを用いて複数の理解結果を得ることで,理解結果の候補を得る.次に,得られた複数の理解結果に対して,ロジスティック回帰に基づき発話単位の信頼度を付与し,その信頼度が最も高い理解結果を選択する.本論文では,言語モデルとして文法モデルとN-gramモデルの2種類,言語理解モデルとしてFinite-State Transducer(FST)とWeighted FST(WFST),Keyphrase-Extractorの3種類を用いた.評価実験では,言語モデル・言語理解モデルのいずれかを複数用いた場合と比較して,コンセプト理解精度の向上が得られた.また,従来のROVER法による理解結果の統合と比較し,本手法の有効性を示した.
- 2010-06-01
著者
-
勝丸 真樹
京都大学大学院情報学研究科
-
中野 幹生
(株)ホンダ・リサーチ・インスティチュート・ジャパン
-
駒谷 和範
京都大学大学院情報学研究科
-
船越 孝太郎
(株)ホンダ・リサーチ・インスティチュート・ジャパン
-
辻野 広司
(株)ホンダ・リサーチ・インスティチュート・ジャパン
-
尾形 哲也
京都大学大学院情報学研究科
-
奥乃 博
京都大学大学院情報学研究科
-
中野 幹生
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
中野 幹生
Ntt基礎研究所
-
中野 幹生
Nttコミュニケーション科学基礎研究所
-
奥乃 博
京都大学
-
奥乃 博
Ntt基礎研究所
-
奥乃 博
Ntt ソフトウェア研究所
-
奥乃 博
日本電信電話(株)基礎研究所
-
奥乃 博
京都大学大学院情報学研究科知能情報学専攻
-
駒谷 和範
京大
-
中野 幹生
(株) ホンダ・リサーチ・インスティチュート・ジャパン
-
奥乃 博
NTT(株)基礎研究所
-
奥野 博
京都大学大学院 情報学研究科 知能情報学専攻
-
駒谷 和範
名古屋大学大学院 工学研究科 電子情報システム専攻
-
中野 幹生
日本電信電話(株)nttコミュニケーション科学基礎研究所
-
奥乃 博
Ntt 基礎研
-
奥乃 博
京都大学大学院
-
中野 幹生
(株)ホンダリサーチインスティチュートジャパン
関連論文
- 音声対話ロボットによる語彙と言い回しの制限がない名称学習(音声,聴覚)
- 複数の言語モデルと言語理解モデルによる音声理解の高精度化(音声認識・理解,情報爆発論文)
- Artificial Subtle Expressionとしての明滅光源による音声対話の円滑化(インタラクションデザイン,人とエージェントのインタラクション論文)
- 4Q-2 音声認識と言語理解を動的に選択する音声理解フレームワーク(音声対話・音声要約,学生セッション,人工知能と認知科学)
- 音声認識と言語理解を動的に選択する音声理解フレームワーク
- 複数の言語モデル・言語理解方式を用いた音声理解の高精度化(理解)
- ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現(ポスターセッション,第10回音声言語シンポジウム)
- 文書分類手法を応用したインタラクティブプレゼンテーションにおける視聴者発話の理解(音声言語処理)
- 3U-6 インタラクティブなプレゼンテーションでのユーザ発話の自然な制限のための複数エージェントの利用(音声言語情報処理,学生セッション,人工知能と認知科学)
- オブジェクト指向に基づくロボット・エージェントのマルチドメイン対話行動制御モジュール構築ツールRIME-TK
- MFTを用いたロボットの動作中における音声認識
- LE-008 音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の高精度化(自然言語・音声・音楽)
- 音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の高精度化(学生セッション I)
- マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択(音声言語)
- 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識
- インタラクション機能を有するプレゼンテーション記述言語の開発(インタフェース,入出力,その他)
- 構文解析の観点からの対話文に特有な現象の分類
- 音声対話ロボットによる語彙と言い回しの制限がない名称学習
- チュートリアル&パネル 対話システム研究の進め方
- 音声対話研究の新しい方向--ASEとSLE
- E-062 家庭用ロボットのための語彙制限の無い発話の頑健な学習と理解(E分野:自然言語・音声・音楽)
- インタラクション機能を有するプレゼンテーション記述言語の開発(HAIにおけるコミュニケーションとインタラクション適応)
- 複数の言語モデルと言語理解モデルによる音声理解の高精度化
- 音声対話システムにおける簡略表現認識のための誤認識増加を抑制する自動語彙拡張(学生セッション II)
- 3U-5 音声対話システムにおけるユーザの固有名詞の簡略化に対処する語彙拡張(音声言語情報処理,学生セッション,人工知能と認知科学)
- D-14-2 未知語音韻認識における音声による誤り訂正手法の検討(D-14.音声,一般セッション)
- DiaLeague : 自然言語処理システムの総合評価
- ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現(ポスターセッション,第10回音声言語シンポジウム)
- ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現(ポスターセッション,第10回音声言語シンポジウム)
- 音声対話システムにおけるラピッドプロトタイピングを指向したWFSTに基づく言語理解
- 文書分類手法を応用したインタラクティブプレゼンテーションにおける視聴者発話の理解(音声言語処理)
- 複数の言語モデルと言語理解モデルによるラピッドプロトタイピング向け音声理解
- TV番組の録画予約を受け付ける実時間音声対話システム
- 多重文脈を用いた逐次的な発話理解
- 細かな発話単位の処理に基づく対話システム
- 対話の低速化とArtificial Subtle Expressionによる発話衝突の抑制
- 対話処理のためのコーパス作成
- LG_002 タスク指向対話とチャットを統合した対話ロボットインターフェース(G分野:音声・音楽)
- ロボットの共生的対話システムとマルチモーダルな表現システムの開発と評価(テーマセッション(1), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- ロボットの共生的対話システムとマルチモーダルな表現システムの開発と評価(テーマセッション(1), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- 【パネル討論】音声インタフェースにおけるWebテキスト処理技術の利用
- 【パネル討論】音声インタフェースにおけるWebテキスト処理技術の利用
- 音声質問応答システムのユーザ発話を用いた質問応答データベース拡張支援
- HRI-JPにおけるヒューマン-ロボットインタラクション研究(システムオンシリコン及び一般)
- 音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の高精度化(学生セッション I)
- 特集「情報処理技術のフロンティア」の編集にあたって(情報処理技術のフロンティア)
- 遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上
- D-14-10 有向性音素グルーピングを用いた音声認識におけるロバスト性向上の検討(D-14.音声・聴覚,一般講演)
- 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化
- 3U-2 複数の言語モデルと言語理解モデルによる音声理解手法のラピッドプロトタイピングへの適用(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5Y-1 複数特徴量を統合したパーティクルフィルタによる物体の検出と追跡(ロボットビジョン,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 音声対話システムにおける簡略表現認識のための誤認識増加を抑制する自動語彙拡張(学生セッション II)
- 3X-9 距離情報を用いた3次元物体認識(3次元画像処理・認識,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 音声インタフェースにおける Web テキスト処理技術の利用
- 複数の形態の入力に対応した選言的素性構造による辞書記述法
- 言い直しを含む発話の解析(並列処理)
- 言い直しを含む発話の解析
- 選言情報を含む単一化文法記述から論理的制約に基づく内部表現への変換法
- 対話状況依存型プラン解析
- 対話状況依存型プラン解析 : 前提条件と効果を取り扱うプラン解析アルゴリズム
- 対話における時間依存プラン認識に向けて
- 分散協調処理による自然言語解析 ( 自然言語処理の実動システム)
- 対話文の文法構築に向けた分析
- 論理的制約の射影演算を用いた単一化に基づく構文解析
- より自然な対話の発話のプラン認識に向けて
- 統語・意味・語用の分散協調処理による対話文理解モデル
- 3U-6 音声質問応答システムのユーザ発話を用いた質問応答データベース拡張支援(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 拡張性の高いマルチドメイン対話システムのための2段ドメイン選択法
- 対話処理システムにおける内的コミュニケーション
- ベイジアンネットワークを用いた参照表現モデルの提案
- ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク
- ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク
- 連続音声から場所の名前を学習する自律移動ロボット
- 状況共有下の経路指示課題における指示ストラテジの分析 (第二回対話システムシンポジウム 一般セッションと対話システム)
- 参照表現ベイジアンネットワークによる参照解決の評価
- 音声対話システムにおける 簡略表現認識のための自動語彙拡張
- 編集にあたって (フィールドを広げる自然言語処理)
- 状況共有下の方向転換課題における対話モデルの検討
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK(オーガナイズドセッション:音声対話,第13回音声言語シンポジウム)
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK(オーガナイズドセッション:音声対話,第13回音声言語シンポジウム)
- 未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正(話者照合・音声認識,第13回音声言語シンポジウム)
- 未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正(話者照合・音声認識,第13回音声言語シンポジウム)
- 確信度表出における人間らしい表現とArtificial Subtle Expressionsとの比較
- 短文を投稿するための音声対話システム
- 短文を投稿するための音声対話システム
- 未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK
- マルチモーダル情報を用いた未知物体検知手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- マルチモーダル情報を用いた未知物体検知手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 奥行と近赤外線反射強度を利用した物体認識手法の検討
- 概念形成のためのロボットによる自律的なマルチモーダル情報の取得
- 移動ロボットによるArtificial Subtle Expressionsを用いた確信度表出
- H-013 3次元特徴量を用いた構造表現による一般物体認識(一般物体認識,H分野:画像認識・メディア理解)
- 音声応用(音声対話)は今後こうなる!
- D-12-16 Web画像を用いたマルチモーダル情報による物体認識(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成))
- 論文特集「知的対話システム」編集にあたって(知的対話システム)
- マルチモーダル情報を用いた未知物体検知手法
- マルチモーダル情報を用いた未知物体検知手法
- 確率的意図推定に基づき対話管理を行う情報検索対話システム
- ロボットに対する移動指示の状況依存逐次理解