対話音声認識における次発話予測の効果
スポンサーリンク
概要
- 論文の詳細を見る
連続音声認識において、次発話を予測することは、認識時の文法の構文的複雑さを低減させ、認識率の向上、認識時間の短縮に役立つであろうと考えられている。また、次発話を予測する枠組みの提案もいくつかなされている。しかしながら、次発話予測の仕組みを直接対話音声認識システム上に実装して評価した例はほとんど報告されていないのが現状である。本研究では、ホテル予約をタスクとする自動通訳システム上に、発話状態(発話タイプ)の遷移可能性に基づいて次発話を予測する手法を提案した。この方法では、ある発話状態から次に遷移可能な状態に属し得る文タイプを持つ発話のみを受理する文法サブセットを適用することにより、認識精度と処理速度の両面の向上を確認した。以下では、この枠組みをさらに拡張し、発話のタイプと話題を組み合わせて発話状態をより詳細に定義した上で、連続する2発話状態から次の状態を予測することにより、さらに効率的な対話音声認識処理を実装した結果を報告する。
- 社団法人電子情報通信学会の論文
- 1996-03-11
著者
-
鈴木 雅美
通信・放送機構
-
鈴木 雅実
通信・放送機構
-
谷戸 文廣
KDD研究所
-
中西 正和
慶應義塾大学 大学院理工学研究科
-
中西 正和
慶應義塾大学大学院理工学研究科開放環境科学
-
中西 正和
慶應義塾大学
-
谷戸 文廣
帝京科学大学
-
鈴木 雅実
Kdd研究所
-
松崎 克郎
慶應義塾大学
-
齋藤 博昭
慶應義塾大学
-
鈴木 雅実
国際電電 研
-
松崎 克郎
慶應義塾大学:ソニー株式会社
関連論文
- 網管理エキスパートシステムのためのSNMP通信スタブ生成ツールの実装
- 学習分野別の共起語情報を用いた学習情報の検索手法の検討
- B-7-34 教育用インターネットにおけるキャッシングの効果について
- 学校間交流支援のためのインターネット上の情報共有について
- 文字間統計情報に基づく口語文字列の自動抽出
- ニューラルネットワークを用いた複数楽器の音源同定処理
- 線形論理のある部分系上の帰納推論とその健全性および完全性
- PRMU2000-33 ニューラルネットワークによる6基本表情認識の規則発見
- 2000-NL-137-9 / 2000-SLP-31-4 日本語略語の自動復元
- 短期記憶を用いたシンプルリカレントネットワークによるカオス時系列の短期予測
- 区間確率密度を用いた不確かさを含む推論法 (テーマ 「オントロジー活用の実際、産業応用」および一般)
- 3G-2 キューを利用した並列計算モデル
- 3N-7 焼きなまし法を用いた対訳単語対抽出
- 3N-5 英語固有名詞のカナ表記への変換
- 1N-2 日本語文書における複合語キーワード抽出
- 4V-8 ウェーブレット信号空間における標本化関数の構成
- 音楽認識の評価方法に関する考察
- 5X-1 教育用日本語プログラミングシステムの構築
- 1N-1 数学的帰納法を用いる定理証明器の実装
- 音声と映像を用いたインタフェースの試作
- NGL法に基づいたリカレントニューラルネットワークの学習
- ニューラルネットワークによる失読症のモデル化
- MDL基準を用いた文書集合の特徴化手法
- 2000-MUS-36-12 リカレントニューラルネットワークを用いたコード進行の自動生成
- ATR音声言語翻訳実験システムASURA
- 短期記憶を用いたリカレントニューラルネットワークと高速な構造学習法
- Flow Graph解析を用いた並列関数型言語処理系の実装
- Logoのビジュアルモデルを用いた問題解決法のマイクロワールド
- 並列LISPシステムにおけるSpeculative Computationに関する研究
- 有理ベゼー曲線を応用した、CGアニメーションのための補間アルゴリズム
- X-Window上におけるLogoインタプリタの実現
- Xインタフェースを構築するための並列lisp処理系Momolisp
- Mach OS上における並列LispインタプリタNico Lispの実現
- 音楽自動演奏システムMIDI-98
- 不完全な履歴情報からの状態遷移経路同定方法の提案
- オペレータ作業支援システムのフィールド試験結果
- オペレータ作業支援システムにおける不要語への対処
- Treeサーチにおける単語固有セルでの尤度判定条件を考慮した音声認識処理の高速化
- 音声認識システム利用者の発話の特徴
- 音声認識技術を用いたオペレータ作業支援システム
- 大規模内線電話受付システム
- 高並列計算機EM-Xの性能モニタリングツール
- 神経グループ選択説に基づく学習システムに関する実験的考察
- 会話型FORTRAN : KEIOシステム
- 音声信号の大局的な構造を利用した音声認識方式
- 音声認識における妨害音声の影響についての検討
- オペレーションルームにおける音声認識に関する一考察
- 時差・エリアコード案内システムの試作
- 発声内容を考慮した実時間ケプストラム平均値正規化の検討
- 日独音声言語翻訳実験システム
- 最大エントロピー法を用いた離散型共起表現の抽出
- 多義語の語義ベクトル分解
- 最大エントロピー法による対訳単語対の抽出
- 共起関係を利用した対訳コーパスからの連語の対訳表現抽出
- bigram 統計情報に基づくパージング
- d-bigram と他の統計情報との関連に関する実験
- 自然言語文評価におけるd-bigram 情報の活用方法に関する実験
- D-15-26 学習用コンテンツの選択的プリフェッチに基づくキャッシングの検討
- 学習分野別の共起語情報を用いた学習情報の検索手法の検討
- 英日翻訳支援システムの翻訳品質の評価
- 波形素片接続型音声合成のための音声データの収集
- 話者照合におけるVQ歪みを用いたDP距離正規化法
- 音声信号処理, 今井聖(著):"音声信号処理",森北出版(1996-11);A5判,定価3,780円
- 人間の感性をベースにした音声信号の心理評価に関する検討
- 複雑な周波数特性近似のための効率的なIIRフィルタ設計方法
- 複雑な周波数特性近似のための効率的なIIRフィルタ設計方法
- 複雑な周波数特性近似のための効率的なIIRフィルタ設計方法
- 任意の周波数特性を実現するIIRフィルタの設計方法
- IIRフィルタによる音場空間伝達関数の設計
- 音声翻訳実験システム(ASURA)のシステム構成と性能評価
- 発話状態の予測に基づく対話音声認識手法とその効果
- 対話音声認識における次発話予測の効果
- 特集「ビジュアルな情報検索」編集にあたって
- D-14-23 高齢者音声の収集および認識実験
- 情報検索タスクにおける音声対話システムの対話管理手法の考察
- 情報検索タスクにおける音声対話の分析
- 検索質問の多義解消へのコーパスの利用
- 5K-5 言語横断的な情報アクセスの利用分野と課題
- 浮世絵表題における複合名詞の自動翻訳
- クロスリンガル情報検索の結果の選択閲覧を支援する翻訳情報提示方法の比較
- クロスリンガル情報検索結果の閲覧支援のための主要キーワード対訳表示の効果
- クロスリンガル情報検索結果の閲覧支援のための主要キーワード対訳表示の効果
- DPマッチングを用いた複合名詞翻訳手法
- 多言語情報検索における利用者支援について : 主要キーワードの対訳付与に関する検討
- 実用指向の言語間情報検索に関する一考察
- 自動通訳システムにおけるマルチモーダルインタフェースの検討
- 発話タイプの予測を用いた対話音声認識方式
- タスク環境を考慮した日韓自動通訳システムのインタフェース改良
- タスク環境を考慮した日韓自動通訳システムのインタフェース改良
- 日韓音声翻訳システムの設計
- 文書構造抽出を用いる機械翻訳システム
- オブジェクト指向型概念辞書COOLにおける共起関係の表現
- 85-34 エキスパート・システムの領域の選択
- 84-4 GLISP : データ抽象化機能を持つLISPベースのプログラミング・システム
- 長尾 真 著, 人工知能シリーズ 2, "言語工学", 昭晃堂, A5判, 246p., \4,300, 1983
- 教育用インターネットに適したキャッシング手法およびミラーリング手法に関する一考察
- 教育用インターネットに適したキャッシング手法およびミラーリング手法に関する一考察
- 異なる言語の情報閲覧を支援する : クロスランゲージ情報検索のインタフェース(マルチリンガル情報アクセス)
- クロスリンガル情報発信のためのキャプション翻訳処理
- クロスリンガル情報検索における閲覧支援機能について