3次元Viterbi法を用いた音素情報と音調情報の統合による中国語連続音声認識
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、3次元Viterbi法により音素情報と音調情報を統合した中国語連続音声認識システムについて報告する。まず基本となる (音調情報を用いない) 連続音声認識システム及び音調認識システムの概要を説明する。前者では60個の音素クラスのHMMを用い、後者では11個の音調単位のHMMを用いている。音素情報と音調情報の結合は、音素モデルの状態と音調モデルの状態と時間との3次元空間において最適なパスを求めることにより行なっている。扱うタスクはホテル予約で、文脈自由文法 (CFG) で中国語の構文を記述している。テストセットパープレキシティは27.3である。10名の話者の各々が発声した107文について、音素情報と音調情報の重みを変化させ、また最適なパスに3種類の制限を加えて実験した結果、最良の結果として平均文認識率75.9%を得た。音調情報を用いない場合より約12.4%改善された。また、この改善は有意水準1%で有意であることがわかった。
- 社団法人電子情報通信学会の論文
- 1997-11-21
著者
関連論文
- ネットサーフィン支援のための音声対話システム
- ネットサーフィンにおける音声入力語彙とその役割
- ネットサーフィンにおける音声入力語彙とその役割
- ネットサーフィンにおける音声コマンド候補の生成について
- 3次元Viterbi法を用いた音素情報と音調情報の統合による中国語連続音声認識
- 連続分布HMMを用いた中国語連続音声の音調認識
- 3次元Viterbi法を用いた音素情報と音調情報の統合による中国語連続音声認識
- 一般化Hough変換を用いたワードスポッティングの精度向上
- 中国語連続音声認識システムにおける音素情報と音調情報の統合方法の検討
- 一般化Hough変換を用いたワードスポッティング
- 基本周波数の2次微分係数を用いた中国語連続音声の音調認識
- WWW上のデータベース検索のための汎用音声インタフェース
- 音素情報と音調情報を統合した中国語連続音声認識
- 音調情報を利用した中国語連続音声認識システムの性能評価
- 音声認識の信頼性に基づいた対話制御方式
- 音節モデルに基づく中国語連続音声の四声音調の認識
- 音声対話の収集について
- 音声に含まれている感情表現について
- 音声対話における快適性の制御要因について
- 音声認識誤りを考慮した対話制御方式
- 音素モデルに基づく中国語連続音声認識システムの性能評価
- 音声認識結果の認識誤り区間と未知語区間の推定
- 音声模擬対話における対話制御と快適性について
- 音声ウェブブラウザVOXplorerの評価
- ジャズセッションシステムのための音楽認識処理の一実現法
- 隠れマルコフモデルを用いたアクセント型の認識
- SPOJUS-SYNOに基づく中国語連続音声認識システム
- タスクに依存しない音声対話の制御方式(音声, 聴覚)
- 擬人化音声対話エージェントのためのタスク管理機能
- 対話における雰囲気の分析
- 対話における雰囲気の分析
- 電話音声応答システムにおける効果音の役割
- VoiceXMLのマルチモーダル化の検討
- TD-PSOLA方法を用いた中国語音声システム
- 対話コーパスからの対話制御情報の取得
- 適応素片を用いた感情音声の合成
- 機械学習を用いた談話タグ推定手法 (テーマ:コーパスを利用した談話・対話研究)
- XML-VoiceXML変換ツールの開発
- XML-VoiceXML変換ツールの開発
- XML-VoiceXML変換ツールの開発
- 非同期型音声会議システムAVMの設計と評価(音声情報処理 : 現状と将来技術論文特集)
- 2000-SLP-32-11 タスクに依存しないフレーム駆動型対話制御方式
- 対話システムのための意味解析ツールの開発
- 非同期型バーチャル会議システムAVM
- Dialogue System Generator from the World Wide Web
- 確認対話の制御方式の効率と音声認識システムの性能との関係
- 「SPOKEN BASIC 1」の認識システム
- 音声認識の誤りを考慮した対話制御方式のモデル化
- 音声対話システムの対話制御と対話の能率について
- 島駆動型音声理解システムにおける言語処理方式
- 単音節を用いた話者適応形単語認識システム
- 音声理解システムにおける言語情報のトップダウン的利用方式
- BUPによる単語予測 : island-driven方式
- WLR距離尺度の軌跡の動的特性に基づく連続音声中の母音認識
- 音韻ラティスと二つのタイプの標準パターンとの照合アルゴリズム
- 一般化Hough変換と連続DPマッチングを用いたワードスポッティング
- 非同期型音声メッセージシステムの提案
- 視覚障害者のための電子メール環境における操作性の検討
- 音声認識の自己目的的な楽しさ
- 音素HMMの最小誤差学習
- 音声認識の自己目的的な楽しさ
- 音声対話システムの対話制御(音声対話システムの実力と課題)
- 6)非同期型音声メッセージシステムの設計(ネットワーク映像メディア研究会)
- 観光案内対話を対象とした自動タグ付けの試み
- 非同期型音声メッセージシステムの設計
- 非同期型音声メッセージシステムの設計