3. 重み付き有限状態トランスデューサによる音声認識(<特集>音声情報処理技術の最先端)
スポンサーリンク
概要
- 論文の詳細を見る
音声認識技術の進展に伴い,数万単語以上の語彙を扱う音声認識が汎用のパーソナルコンピュータ上で動作するようになった.この背景には,これまでに培われた音声認識アルゴリズムの効率化に関する数々の研究成果がある.しかし,その一方で音声認識のアルゴリズムは複雑化し,システムの保守・拡張が困難になる傾向があった.近年,このような従来手法に代わるアプローチとして,重み付き有限状態トランスデューサ(Weighted Finite-State Transducer: WFST)による音声認識が注目を集めている.WFSTは確固たる理論に支えら,拡張性の高いシステムの構築と従来手法を凌ぐ高速な音声認識を実現する.本稿では,WFSTによる音声認識を紹介し,従来の音声認識との相違点を明らかにする.さらに,WFSTによってもたらされる音声認識の今後の展開について述べる.
- 一般社団法人情報処理学会の論文
- 2004-10-15
著者
関連論文
- 8-2 日本企業から米国・欧州大学への派遣体験 : 米国マサチューセッツ工科大学編/スイス連邦チューリッヒ工科大学編(8.企業からの客員研究員の海外派遣,私の国際交流の経験)
- 音声認識の応用システム : 音声ドキュメント検索・音声翻訳・音声対話の新たな展開(自動音声認識研究の動向と展望)
- 世界メディアブラウザ--音声認識と統計翻訳に基づく多言語動画コンテンツ検索/閲覧システム
- 音声認識の確信度と識別モデルを利用した音声からの固有表現抽出
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 有限状態トランスデューサによる音声認識・文整形・要約処理の統合
- 複数音響環境の発話単位遷移モデルに基づく適応学習法の検討(認識,理解,対話,一般)
- 識別的誤り訂正学習における対立単語列と素性の選定(特徴量・音響モデル,第9回音声言語シンポジウム)
- 識別的誤り訂正学習における対立単語列と素性の選定(特徴量・音響モデル,第9回音声言語シンポジウム)
- 識別的誤り訂正学習における対立単語列と素性の選定(特徴量・音響モデル,第9回音声言語シンポジウム)
- 単語並び換えモデルを考慮した統計的階層句機械翻訳システム
- 単語並び換えモデルを考慮した統計的階層句機械翻訳システム
- サーチエラーリスク最小化に基づくViterbiビーム探索とその評価(デコーダ,第11回音声言語シンポジウム)
- サーチエラーリスク最小化に基づくViterbiビーム探索とその評価(デコーダ,第11回音声言語シンポジウム)
- 機械翻訳最新事情 : (下)評価型ワークショップの動向と日本からの貢献
- 機械翻訳最新事情 : (上)統計的機械翻訳入門
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパス(公開版Ver.1.0)による評価(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 単語並び換えモデルを考慮した統計的階層句機械翻訳システム
- 世界メディアブラウザ (特集 コミュニケーション科学の融合研究における新潮流)
- 3. 重み付き有限状態トランスデューサによる音声認識(音声情報処理技術の最先端)
- 確率主成分分析を用いた音声認識の日本語話し言葉コーパスにおける評価
- 高次の音素環境依存モデルを統合した重み付き有限状態トランスデューサの効率的生成法
- 高次の音素環境依存モデルを統合した重み付き有限状態トランスデューサの効率的生成法(大語彙音声認識)(第6回音声言語シンポジウム)
- 混成主成分分析を用いた音声認識(ポスターセッション)
- 混合主成分分析を用いた音声認識
- 高次の音素環境依存モデルを統合した重み付き有限状態トランスデューサの効率的生成法(大語彙音声認識)(第6回音声言語シンポジウム)
- 高次の音素環境依存モデルを統合した重み付き有限状態トランスデューサの効率的生成法(大語彙音声認識)(第6回音声言語シンポジウム)
- 混合主成分分析を用いた音声認識(ポスターセッション)
- 混合主成分分析を用いた音声認識(ポスターセッション)
- 音声インタラクティブODQAの構築とその評価
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 混合主成分分析を用いた音声認識
- 混合主成分分析を用いた音声認識
- コンフュージョンネットワークを用いたオープン語彙発話検索法とその評価
- HMM状態-単語の同時確率を用いた音声言語処理のための複雑度指標
- 高次の音素環境依存モデルを統合した重み付き有限状態トランスデューサの効率的生成法
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 音声認識アルゴリズムの最前線(オーガナイズドセッション:音声認識及び翻訳アルゴリズム最前線,認識,理解,対話,一般)
- 統計翻訳アルゴリズムの最前線(オーガナイズドセッション:音声認識及び翻訳アルゴリズム最前線,認識,理解,対話,一般)
- Deep Learningに基づく音声特徴量の有限状態トランスデューサ型識別モデルによる識別 (音声)
- 複数人会話シーン分析の研究と今後の展望(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)