音素履歴木を用いたフレーム同期型SSS-LR文音声認識
スポンサーリンク
概要
- 論文の詳細を見る
連続発声された文音声の認識では、文節発声に比較して文法的暖昧性が増加する。従来用いられていた音素同期型HMM-LRでは、1つのLRスタックを1つのセルで表現するために、文法的暖昧性の増加に伴い同一音素列に対する仮説数も増加する。このため、音素照合が重複し処理時間が多くなる問題点があった。また、音素同期型探索では尤度の正規化が必要であるが、正規化の精度が悪いと認識率が低下する問題点があった。本論文では、音素履歴木を用いたフレーム同期型SSS-LR連続音声認識手法を提案する。本手法は、統語解析部に(1)音素履歴木(2)状態ネットワークを導入し、文法的暖昧性の増加に起因する仮説数の増加を抑えた効率的なフレーム同期型処理を実現した。なお、HMMモデルは音素照合の高精度化を図るためSSSアルゴリズムで作成したコンテキスト依存HMMモデルを使用した。また、本手法を用いた特定話者。不特定話者文認識実験結果について述べる。
- 一般社団法人情報処理学会の論文
- 1994-09-20
著者
-
清水 徹
ATR音声言語コミュニケーション研究所
-
松永 昭一
ATR音声翻訳通信研究所
-
シンガー ハラルド
ATR音声翻訳通信研究所
-
清水 徹
Atr音声翻訳通信研究所
-
松永 昭一
Atr音声翻訳通信研究所:現在 Nttヒューマンインタフェース研究所
-
門前 聖康
山形大学
関連論文
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- アスペクト解釈に基づく複合語のアクセント句分割
- 音声翻訳研究20年の夜明け : 受賞業績 携帯電話によるネットワーク型コーパスベース音声翻訳システムの構築(平成19年度喜安記念業績賞紹介)
- 2D-5 多言語音声翻訳基盤の通信インタフェースの検討と構築(音声対話・翻訳,一般セッション,人工知能と認知科学)
- 雑音の特徴分析に向けた実環境雑音データベースの構築
- ATR実環境雑音DB-ATRANS-を用いた雑音重畳音声認識実験(耐雑音)
- 2 ここまできた音声翻訳技術(多言語自動通訳技術の実現に向けて)
- コミュニケーション効率に基づく音声翻訳システムの評価(異文化コラボレーション論文)
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用(第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価(第8回音声言語シンポジウム)
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価(Session-3 コミュニケーション・対話,第8回音声言語シンポジウム)
- 課題遂行型対話実験による日英及び日中音声翻訳システムの評価
- 音声翻訳研究の展開(機械翻訳)
- 翻訳可能なフレーズを単位とした音声認識結果の信頼度評価
- 携帯電話音声に含まれる雑音のモデル化による音声区間検出誤りの削減
- 混合分布HMMにおけるTree-basedクラスタリング(音声情報処理 : 現状と将来技術論文特集)
- D-14-9 電話音声認識を用いた株価情報案内システム
- 2D-4 同時通訳者の知識を用いた講演文章のチャンキング(音声対話・翻訳,一般セッション,人工知能と認知科学)
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験
- ユーザインタフェース管理システムにおける対話の設計
- 最大事後確率推定法と適応データ量に応じた平滑化手法を用いた話者適応
- 話者クラスタリング手法を用いた不特定話者音素HMM作成法
- MAP-VFS話者適応法における平滑化係数制御の効果
- 発話/話者適応による自由発話音声中の音素認識
- 木構造話者クラスタリングを用いた話者適応
- 最大事後確率推定法と移動ベクトル場平滑化法を統合した話者適応方式
- 話者適応のための木構造話者クラスタリング
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 多言語音声コミュニケーションプラットホームと音声翻訳への応用
- コミュニケーション効率に基づく課題遂行型音声対話の評価(Session-3 コミュニケーション・対話,第8回音声言語シンポジウム)
- 全音素エルゴディック隠れマルコフ網を用いた教師なし話者適応方式
- 音素環境依存LRテーブル作成法とその連続音声認識システムへの応用
- 逐次状態分割法の分割過程木構造を用いた話者適応方式の検討
- 逐次状態分割法の分割過程を考慮した移動ベクトル場平滑化の検討
- 音素クラスタモデルを用いた未登録語検出法の検討
- 音素クラスタモデルを用いた未登録語の検出法の検討
- 連続音声認識における未知語検出の検討
- 対話音声を対象とした連続音声認識システムの試作と評価
- 旅行会話タスクにおけるTARSPRECの性能評価
- 携帯電話型音声翻訳システムATR-MATRIX
- クライアント・サーバ型ATR-MATRIX
- 日英音声翻訳システムATR-MATRIXにおける音声認識用音響・言語モデル
- MCE/GPDを用いた自然発話音声認識における不特定話者音響モデルの改善
- クライアント・サーバ型 ATR-MATRIX
- 4E-7 ATR-MATRIX:日英双方向音声翻訳システム
- 大語い連続音声認識のための単語仮説数削減
- Delayed decisionビーム探索の検討
- 単語グラフと可変長N-gramを用いた大語彙自然発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた連続音声認識法
- 語順の制約による探索空間の削減効果
- 音素履歴木を用いたフレーム同期型SSS-LR文音声認識
- 地域や年齢的な広がりを考慮した大規模な日本語音声データベース
- 言語情報を用いた教師なしのQuasi-Bayesオンライン話者適応
- フォームエディタにおける情報分割に関する一考察
- 大規模な日本語音声データによる音響モデルの分析
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- スペクトルサブバンドセントロイドを用いた雑音下での音声認識
- スペクトルサブバンドセントロイドを用いた雑音下での音声認識
- ACOUSTIC MODELS FOR SPEECH RECOGNITION : A SURVEY
- SCALAR QUANTIZATION OF CEPSTRAL PARAMETERS FOR LOW BANDWIDTH CLIENT-SERVER SPEECH RECOGNITION SYSTEMS
- 品詞および可変長単語列の複合N-gramの自動生成
- 連続音声認識のための品詞・単語可変長N-gram
- 連続音声認識のための可変長連鎖統計言語モデル
- 状態別話者クラスタリングを用いた不特定話者モデルの検討
- 母音および無音のHMMを用いた音声始端検出法
- 音響モデルの構造決定のための統一的な枠組 : 最尤推定による逐次状態分割法と質問に基づく決定木生成法
- PARALLEL JAPANESE/ENGLISH SPEECH RECOGNITION IN ATRSPREC
- DISTANCE-RELATED UNIT ASSOCIATION MAXIMUM ENTROPY LANGUAGE MODELING
- 日英音声翻訳システム「ATR-MATRIX」における音声認識部分の構造と制御方法
- 複数音素にまたがる誤認識特性を用いた音素候補系列追加モデル
- ML-SSSに基づく自然発話音声のための音響モデル作成
- 尤度最大基準に基づく逐次状態分割法
- F_0生成モデルを用いたテンプレートに基づく連続音声の句境界検出
- F_0生成モデルに基づくアクセントテンプレートの連続整合による句境界検出
- 韻律モデルを用いたF_Oクラスタリングに基づくアクセント句境界検出
- 韻律モデルを用いたF_0クラスタリングに基づくアクセント句境界検出
- 自由曲面の多面体近似とその応用 : 凹凸曲面の多面体近似
- 自由曲面の多面体近似とその応用 : 2次曲面の多面体近似