音声認識における仮名・漢字文字連鎖確率に基づく統計的言語モデルの利用
スポンサーリンク
概要
- 論文の詳細を見る
仮名・漢字の文字連鎖確率に基づく統計的言語モデルを利用した日本語Dictationシステムについて述べる.日本語の統計的言語モデルとして,仮名・漢字の文字連鎖確率(次に出現する文字の,既に出現した2文字による条件付き確率)に基づくモデルを利用した方が,従来の音韻や音節の連鎖確率に基づくモデルよりも有効であることを,パープレキシティ(情報論的な意味での平均分枝数)に基づいて検討する.更に,仮名・漢字連鎖のモデルを用いた日本語Dictationシステムを構築し,(1)仮名・漢字連鎖確率のみによるモデルを利用した場合,(2)(1)モデルと読みの辞書を用いて,出力された漢字仮名混じり系列に対する読みを考慮した場合,(3)あらかじめ読みを考慮して作成した,仮名・漢字連鎖確率によるモデルを用いた場合について,パープレキシティとシステムの文字変換率(正解表記に用いられる文字を,出力文字系列がいくつ含んでいるか),文節変換率(出力文字系列がすべて正しく,かつその読みも正しいものの割合)で比較・検討する.国際会議の問合せに関するタスクにおいて,特定話者1名による,語いの仮定なしでの274文節の変換実験に対し,(3)の場合に,文節変換率65.0%,文字変換率79.0%を達成した.
- 社団法人電子情報通信学会の論文
- 1994-02-25
著者
-
鹿野 清宏
NTTヒューマンインタフェース研究所
-
山田 智一
NTTヒューマンインタフェース研究所
-
川端 豪
ATR自動翻訳電話研究所
-
松永 昭一
(株)ATR音声翻訳通信研究所
-
川端 豪
NTT基礎研究所
関連論文
- 音韻ラベルを用いない HMM 評価法とそれを用いた連続音声認識用 HMM の評価
- 番号案内を対象とした大語い連続音声認識アルゴリズム
- フレーム間相関を利用した音韻 HMM による音声認識
- 電話番号案内を対象としたマルチモーダル対話システムの作成と音声入力の評価
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- 実対話音声を用いた有限状態トフンスデューサ型認識デコーダの評価
- 話者クラスタリング手法を用いた不特定話者音素HMM作成法
- 木構造話者クラスタリングを用いた話者適応
- 音声対話によるテキスト内容の伝達方法
- 韻律情報に着目した相互理解発話モデル
- 非言語的現象の分析と対話処理 : 電子メール討論(音声対話システムの実力と課題)
- 文型と音調によるユーザ発話行為理解
- 逐次的音声認識・理解のためのISTARアーキテクチャ
- 文型と音調によるユーザの発話意図の推定
- TV番組の録画予約を受け付ける実時間音声対話システム
- 多重文脈を用いた逐次的な発話理解
- 細かな発話単位の処理に基づく対話システム
- 話しことば対話によるテキスト内容の伝達
- 話しことば対話によるテキスト内容の伝達
- 複数の対話ドメインにおける協調的対話原則の分析
- 音声対話システムNoddy : ユーザ発話途中でのうなずき・相槌生成
- わかってうなずくコンピュータの試作
- わかってうなずくコンピュータの試作
- わかってうなずくコンピュータの試作
- VQコードのBigramで制約した音韻HMMによる音声認識
- 学習用テキストからの認識探索空間作成能力の評価
- 音節連鎖統計情報のタスク適応化
- Top-Down音韻認識とBottom-Up音韻認識を融合した音声認識
- Top-down音韻認識とBottom-up音韻認識を融合した音声認識 (音声認識)
- 音響ストリーム分離の音声認識からの評価
- 音響ストリーム分離の音声認識からの評価
- 音環境理解のためのマルチエージェントによる調波構造ストリームの分離
- マルチエージェントシステムによる音響ストリーム分離 : ストリーム分離の排他性の向上
- マルチエージェントシステムによる音響ストリーム分離のダイナミクス
- 創発的計算モデルによる音環境理解 : 音響ストリーム分離エージェントの構築と評価
- 音声認識エンジンREXの開発
- 音声認識における仮名・漢字文字連鎖確率に基づく統計的言語モデルの利用
- HMM-LR音声認識システムの性能評価
- HMM音韻認識と拡張LR構文解析法を用いた連続音声認識
- SL-TRANSにおける文節音声認識 : HMM音韻認識とLR構文解析法による文節音声認識
- Hidden Markov モデルによる日本語有声破裂音の認識
- 音声情報の認識と理解 (認識と理解) -- (応用分野から見た認識と理解)
- 大語彙連続音声確認のためのコンパクトな可変長n-gramモデル
- 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識
- 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識
- 音声認識合成による応用構築の容易な電話対話システム
- 音声研究会報告 : 解説と展望
- 音声認識合成による応用構築の容易な電話音声対話システム
- 対話調整の表出における韻律的特徴の分析
- 対話調整の表出における韻律的特徴の分析
- 音声の音響的特性を用いた顔方向認識
- 音声の音響的特性を用いた顔方向認識
- 音声対話の発話交代に関わる現象の分析
- 共同作業タスクにおける対話の分析
- 二項事後分布に基づくN-gram言語モデルのBack-off平滑化
- 二項事後分布に基づくN-gram言語モデルのBack-off平滑化
- 共同作業タスクにおける対話の分析
- 談話標識語の音韻的研究(II)
- 談話標識語の音韻的研究(II)
- 談話標識語の音韻的研究
- 談話標識語の音韻的研究
- Delayed Arc EvaluationによるLRパーザ制御に基づくViterbiサーチ
- 音声認識機能を持つ住所入力システム
- 音声入力機能を持つ住所入力システム
- 音声認識機能を持つ住所入力システム
- 音声認識における新しい高速化
- HMM-LR方式音声認識サーバを用いたマルチモーダル入力
- 語彙制約なし音声認識における音節継続時間長制御の効果
- クライアント・サーバ構成のHMM-LR連続音声認識システムとその応用
- 実時間音声認識における高精度探索方式--音素環境依存モデルを用いたHMM-LR音声認識方式の高速化 (インタラクティブな音声インタフェ-スの実現を目指して)
- 音声理解システムJUNOにおける対話マスコット
- 残差駆動型アーキテクチャの提案と音響ストリーム分離への応用
- BPD Back-off法における継承係数の決定法
- N-gram記号連鎖確率の統計的性質
- 音声認識のための新しい言語処理
- 二項事後分布に基づくN-gram言語モデルのBack-off平滑化
- 確率文法と話題マルコフモデルに基づく音声認識のための話題制御
- 確率文法と話題マルコフモデルに基づく音声認識のための話題制御
- 連接共起に注目した単語のクラスタリング
- 共同作業タスクにおける対話の分析
- 二項事後分布に基づくn-gram言語モデルのback-off平滑化
- 統計的言語モデルのための単語分類法と評価法の検討
- 音声対話を通した共同作業タスクの検討
- 音声対話を通した共同作業タスクの検討
- 調波構造と方向同定に基づく音響ストリーム分離
- 不特定話者音声認識のための予測子コードブックの構成法