HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
スポンサーリンク
概要
- 論文の詳細を見る
本稿は、大語彙の連続音声認識を実時間で処理するための、HMM-LR連続音声認識装置の設計、処理性能について述べる。HMM-LR法は、一般化LR構文解析により入力音声データ中の音素を予測し、予測された音素の存在確率をHMM音素照合により調べることで、音声認識と言語処理を同時進行させる方式であり、高精度で効率的な処理系を構成することができる。処理量が極めて大きな継続時間制御付きトレリス計算を伴うHMM-LR連続音声認識を実時間で実行するために、本装置は種々の高速化手法を33個のDSPを用いて実現した。その結果、連続文節発声の入力音声に対し、入力文の長さに依らずに、発声終了後から2〜3秒ですべての認識処理を終了する処理速度を達成した。
- 社団法人日本音響学会の論文
- 1994-09-01
著者
-
鈴木 忠
三菱電機(株)情報技術総合研究所
-
鈴木 忠
三菱電機・情報総研
-
花沢 利行
三菱電機(株)情報技術総合研究所
-
永井 明人
ATR自動翻訳電話研究所
-
北 研二
ATR自動翻訳電話研究所
-
花沢 利行
ATR自動翻訳電話研究所
-
川端 豪
ATR自動翻訳電話研究所
-
鹿野 清宏
ATR自動翻訳電話研究所
-
森元 逞
ATR自動翻訳電話研究所
-
嵯峨山 茂樹
ATR自動翻訳電話研究所
-
榑松 明
ATR自動翻訳電話研究所
-
鈴木 忠
三菱電機情報システム研究所
-
岩崎 知宏
三菱電機情報システム研究所
-
中島 邦男
三菱電機情報システム研究所
-
嵯峨山 茂樹
Atr Interpreting Telephony Research Laboratories
-
槫松 明
ATR自動翻訳電話研究所
-
森元 逞
ATR音声翻訳通信研究所
-
中島 邦男
三菱電機株式会社情報技術総合研究所:(現)横浜国立大学産学連携推進本部
-
永井 明人
三菱電機・情報総研
関連論文
- カーナビゲーション向け音声認識の新たな展開 (特集 次世代の車づくりに貢献する先進技術)
- D-14-16 音素脱落を許す単語モデルを用いた日本人英語の認識
- VQ写像を用いた2入力SSによる非定常騒音下の音声認識
- 日本人英語認識におけるマルチ単語モデルの改良
- 複数単語モデルによる日本人英語音声認識の検討
- 日本人英語の発話様態を考慮した英語音声連続認識の検討
- 発声変形モデルを用いた騒音環境下音声認識
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- 自動車内騒音化における音声認識方式の検討
- 日本人英語認識における単語モデル構成法の検討
- 日本人英語音声認識における音響モデルの検討
- 日本人発声者による英語音声の認識
- 重畳雑音のパタン選択とパワー推定を用いた騒音下音声認識手法の改良
- 雑音標準パタンを用いた非定常騒音下音声認識の検討
- 隠れマルコフ網と一般化LR構文解析を統合した連続音声認識
- 多対多最小パターンアライメントアルゴリズムの提案と自動読み付与による評価
- 統計的声質変換に基づく食道音声強調における声質制御
- 音声翻訳システムのための声質変換法と日中英語間における評価
- EA2010-30 反復型スペクトル減算法におけるミュージカルノイズ発生量の数理解析
- EA2010-29 オーディオオブジェクト定位情報に基づく楽曲サムネイル自動生成手法
- 未知語認識のための仮名・漢字単位の構築手法と性能評価
- HMM音声合成における系列内変動モデリング手法の評価
- 異なる収録機器に対応した肉伝導音声変換のための音響特性自動補正
- 1対多固有声変換に基づく無喉頭音声の音質及び話者性の改善
- 任意乗スペクトル減算法におけるミュージカルノイズ発生量の数理解析(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- D-5-8 単語の連想関係に基づく概念検索方式の評価(D-5. 言語理解とコミュニケーション, 情報・システム1)
- 音声認識における仮名・漢字文字連鎖確率に基づく統計的言語モデルの利用
- HMM-LR音声認識システムの性能評価
- HMM音韻認識と拡張LR構文解析法を用いた連続音声認識
- SL-TRANSにおける文節音声認識 : HMM音韻認識とLR構文解析法による文節音声認識
- Hidden Markov モデルによる日本語有声破裂音の認識
- 音声情報の認識と理解 (認識と理解) -- (応用分野から見た認識と理解)
- 対話文脈を利用した概念素に基づく音声理解
- 概念素に基づく音声理解への統計的言語制約の導入
- 音声対話における話題推定に基づいた情報提供手法
- 概念素理解方式による音声理解への統計的言語制約の導入
- 対話システムのための概念素理解方式による対話音声理解
- 対話システムのための概念素理解方式による一般的文意理解
- ユーザの行動目的の推定による協調的な音声対話制御
- 慣用表現を利用した形態素情報収集法
- Mathematical metric of musical noise in Wiener filtering (音声)
- D-14-12 車室内で発生する規則性非定常騒音下での音声認識
- 音声認識技術の変遷
- D-14-10 N-gram言語モデルを用いた音声対話システムにおける冗長語処理の検討
- タスクの例文を用いた自由発話音声認識のための言語モデルの構築
- SD-3-3 N-gramモデルを用いた音声対話システムのための音声認識の検討
- D-14-20 音声対話システムにおける少量テキストを用いた言語モデルのタスク適応に関する検討
- 自由発話音声認識のためのトライ音節モデルの検討
- 音声対話システムにおける教師なし話者適応の検討
- 音声対話システムにおける湧き出し誤りのリジェクト方式の検討
- 認識結果の信頼度を考慮した教師無し話者適応方式の検討
- D-14-7 符号化データを用いた音声認識方式の検討
- 音声認識候補の正規化認識確率に関する考察
- D-5-7 情報検索のタスク評価手法に関する一考察(D-5. 言語理解とコミュニケーション)
- ニューラルネットを用いた音声処理
- ニューラルネットワークの音声情報処理への応用
- D-14-4 連続音声認識における音節継続時間情報を用いた演算量削減(D-14.音声・聴覚,一般講演)
- D-14-6 統計言語モデルを用いた連続音声認識における単語グループ間バイグラムの削減(D-14.音声・聴覚,一般講演)
- 音声認識技術
- 音声認識技術とその応用 (特集 IT時代のヒューマンインタフェース技術)
- ピッチパタンの統計モデルに基づく句境界情報を利用した文節スポッティング
- 単語リジェクト方式のキーワードスポッティングによる評価
- インターネット情報監視システムの試作
- Mathematical metric of speech distortion in various types of BSSA (音声)
- Unsupervised parameter identification of MMSE STSA estimator (音声)
- Unsupervised parameter identification of MMSE STSA estimator (信号処理)
- Unsupervised parameter identification of MMSE STSA estimator (応用音響)
- Mathematical metric of speech distortion in various types of BSSA (信号処理)
- Mathematical metric of speech distortion in various types of BSSA (応用音響)
- A-4-4 ICAにおける確率統計モデルを用いたパーミュテーション解決法(A-4.信号処理,一般セッション)
- 統計的機械翻訳の手法を用いた音声情報案内システムのための応答文生成手法の検討
- D-5-1 インタネット全文検索と関連文書検索を用いたポータル構築支援
- ユーザの行動目標に基づく対話管理手法
- D-14-7 必須形態素の検証によるテキスト検索の改善(D-14.音声,一般セッション)
- HMM-LR音声認識の大語彙への適用
- 音声認識システムにおける確率文法の有効性
- 音声理解研究の動向 (<小特集>音声情報処理の最近の動向)
- 教師音として抽出対象信号情報を用いた非負値行列因子分解による目的楽器音信号の抽出 (応用音響)
- E-16 単語共起照合に基づくクレーム抽出方式の改良(情報抽出,E.自然言語・文書)
- 非線形処理におけるミュージカルノイズ発生量と音声認識率の関係(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 様々なウィーナフィルタにおけるミュージカルノイズ発生量の数理解析(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- テキスト・データベースからの慣用表現の自動抽出
- 文節スポッティングにおける未知語検出方式の改良
- 自由発話音声における音韻の変形傾向を考慮した音響モデル構成法の検討
- 文節スポッティングにおける未知語処理方式の検討
- 意味主導型音声理解システムのための文節スポッティングの改良
- ベクトル量子化話者適応のHMM音韻認識への適用
- 概念依存関係を用いた概念素理解方式の音声理解性能の評価
- 概念素理解方式における不要語・未知語を考慮した文意探索手法
- 概念依存関係による概念素統合に基づいた音声理解
- 概念素理解方式の一般化とタスク知識の適用手法
- 概念素に基づく意味理解における言語知識の詳細化
- 概念素に基づく意味理解の文の表現性の拡張
- 概念素に基づく意味理解における音声認識への統合手法
- 概念素探索法における概念素仮説からの文意統合方式
- 音声検索技術とその応用 (特集 ヒューマンインタフェースを支える先端技術 : 新たな価値創造に向けて)
- 音声と騒音の密度比推定を用いた音声区間検出法(音声入力・区間検出,認識,理解,対話,一般)
- 音声と騒音の密度比推定を用いた音声区間検出法