統計処理による入力文から中間表現への変換を用いた音声言語理解
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 音声認識誤りを含む文, 及び自然発話文の理解を可能とするため, 統計的手法により入力文を中間表現に変換することを特徴とした音声・言語理解手法を提案する. 提案法は, 中間表現の各要素から文の生成確率を与える隠れマルコフモデル, 及び中間表現の各要素間の共起確率を用いた手法である. 15話者82発話に対して行った実験の結果, 正しい文章が入力された場合の言語理解率は91.5%であった. また, 音声認識システムと結合させた場合の音声理解率は73.2%であり, 文認識率 (59.8%) よりも約13%高く, ある程度の認識誤りが含まれる文に対しても正しい理解が得られることを確認した.
- 社団法人電子情報通信学会の論文
- 1999-02-25
著者
-
匂坂 芳典
(株)エイ・ティ・アール音声翻訳通信研究所
-
谷垣 宏一
(株)エイ・ティ・アール音声言語通信研究所
-
谷垣 宏一
(株)エイ・ティ・アール音声言語通信研究所:(現)三菱電機株式会社情報技術総合研究所
-
政瀧 浩和
(株)エイ・ティ・アール音声翻訳通信研究所
関連論文
- 対話者の前発話を利用した統計的言語モデル
- クラスに依存した語彙の確率的記述に基づく階層型言語モデル
- 韻律制御パラメータ数を考慮した評価尺度に基づく韻律句境界の自動検出
- 統計的手法を用いた基本周波数制御規則の自動抽出
- 日英音声翻訳システムATR-MATRIXにおける音声認識用音響・言語モデル
- 大語い連続音声認識のための単語仮説数削減
- 単語グラフと可変長N-gramを用いた大語彙自然発話音声認識
- 発音ネットワークに基づく発音辞書の自動生成
- 複数決定木の動的順序付けに基づく発話の概念推定 (音声言語情報処理)
- 統計処理による入力文から中間表現への変換を用いた音声言語理解
- 品詞および可変長形態素列の複合N-gramを用いた日本語形態素解析
- 最大事後確率推定によるN-gram言語モデルのタスク適応
- 品詞および可変長単語列の複合N-gramの自動生成
- MAP推定に基づくN-gram言語モデルの自動分類されたコーパスへの適応
- 統計的手法による認識結果から中間表現への変換を用いた音声理解システム
- 決定木を用いた発話の意味タグ推定
- 統計的処理による音声・言語理解モデル
- MAP推定によるN-gram言語モデル
- MAP推定を用いたN-gram言語モデルのタスク適応
- 連続音声認識のための品詞・単語可変長N-gram
- 連続音声認識のための可変長連鎖統計言語モデル
- 中間言語表現の生成を目的とした統計的音声理解方式(音声情報処理 : 現状と将来技術論文特集)
- 語彙クラスに依存した未登録語モデルに基づく統計的言語モデル
- 対話における相手話者の前発話に対する中間言語表現を利用した言語モデル
- 未登録語のクラス依存サブワードモデルを用いた音声認識
- 未登録語のクラス依存サブワードモデルを用いた音声認識
- 中間言語表現の生成を目的とした音声理解