2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(システム・信頼度)(第5回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
音声認識システムにおいて,認識結果に対して事後確率などを用いて信頼度を付与することで,発話検証や対話管理などの音声アプリケーションにおいて認識誤りを考慮したより高度な処理を行うことができる.この単語の事後確率を用いた信頼度算出では,通常,認識処理(デコーディング)の結果得られた仮説群のゆう度をもとに計算されるが,十分な精度の確信度を得るためにはN-best候補で数百以上の大量の文仮説を求める必要があり,多くの計算量を必要とする.本研究では,2パストリートレリス探索に基づくデコーディングにおいて,探索中に得られる部分文仮説の尤度から単語の信頼度を簡易かつ高速に算出するアルゴリズムを提案する.後段パスのスタックデコーディングにおける単語仮説展開時に,その次単語仮説の集合およびそれぞれから展開される新たな仮説のヒューリスティックを含む尤度から,その展開単語の事後確率を計算する.通常のデコーディング処理に対して極めて少ない計算量で信頼度を計算できる.認識エンジンJuliusにおいて,N-best候補から事後確率を算出する従来手法との比較を行った結果,提案手法は大量のN-best候補を求める必要がないことから認識処理全体を非常に高速に行え,また信頼度の精度も,簡易な計算法ながらN-best候補を用いる手法と同等以上の信頼度を算出できることが示された.
- 一般社団法人情報処理学会の論文
- 2003-12-18
著者
-
李 晃伸
名古屋工業大学
-
李 晃伸
奈良先端科学技術大学院大学情報科学研究科
-
河原 達也
京都大学 情報学研究科
-
李晃伸
名古屋工業大学大学院情報工学専攻
-
鹿野 清宏
奈良先端科学技術大学院大学
-
李 晃伸
名古屋工業大学大学院工学研究科
-
河原 達也
京都大学 学術情報メディアセンター
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 音声認識のデコーダと認識エンジン(自動音声認識研究の動向と展望)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
- 実環境における頑健な音声認識のための音韻モデルの教師なし話者適応(音声,聴覚)
- 信頼度基準による解探索打ち切りに基づく超早音声認識
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 複数の音素決定木構造を含む統計モデルに基づく音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 複数の音素決定木構造を含む統計モデルに基づく音声認識(ポスターセッション,第10回音声言語シンポジウム)
- HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 複数の音素決定木構造を含む統計モデルに基づく音声認識(ポスターセッション,第10回音声言語シンポジウム)
- HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
- 4L-3 ハンズフリーロボット対話実験システムの構築(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- 3L-7 大語彙連続音声認識ソフトウェアJuliusのマイコンへの実装(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 3L-1 音声情報案内システム「たけまるくん」の運用(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価(雑音・VAD,第9回音声言語シンポジウム)
- 音声対話システムのためのN-gramに基づくキーワードからの文生成(対話,第11回音声言語シンポジウム)
- 音声対話システムのためのN-gramに基づくキーワードからの文生成(対話,第11回音声言語シンポジウム)
- 音声対話システムにおける発話文の自動クラスタリングに基づく応答選択(話し言葉処理)
- 音素決定木構造のアニーリングに基づく音響モデリング(聴覚・音声/一般)
- フレーム単位の信頼度を用いた並列音声認識におけるデコーダ間枝刈りの検討(音声認識)
- ユーザ生成型音声対話コンテンツを用いた音声情報案内システム(一般(ポスターセッション),第11回音声言語シンポジウム)
- ユーザ生成型音声対話コンテンツを用いた音声情報案内システム(一般(ポスターセッション),第11回音声言語シンポジウム)
- ロボットにおける音声認識技術
- 実環境研究プラットホームとしての音声情報案内システムの運用(音声,聴覚)
- 複数の特徴量による条件付確率場に基づく音声区間検出(韻律・VAD,第11回音声言語シンポジウム)
- 音声認識のための非線形スペクトル変換を用いた話者適応(音響モデル,第11回音声言語シンポジウム)
- 複数の特徴量による条件付確率場に基づく音声区間検出(韻律・VAD,第11回音声言語シンポジウム)
- 音声認識のための非線形スペクトル変換を用いた話者適応(音響モデル,第11回音声言語シンポジウム)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 既知雑音重畳を用いたフレームベース減算型残響抑圧処理の評価
- AS-4-4 実環境下における多段独立成分分析の音声認識評価(AS-4. 多チャンネル音響信号処理, 基礎・境界)
- 3L-6 大語彙連続音声認識エンジンJuliusバージョン4.0の構成と機能(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 大語彙連続音声認識エンジンJulius ver.4(システム,第9回音声言語シンポジウム)
- 大語彙連続音声認識エンジンJulius ver. 4(システム,第9回音声言語シンポジウム)
- 大語彙連続音声認識エンジンJulius ver.4(システム,第9回音声言語シンポジウム)
- 大語彙連続音声認識エンジンJuliusの開発の進展(Session-5, 第7回音声言語シンポジウム)
- 大語彙連続音声認識エンジンJuliusの開発の進展(Session-5, 第7回音声言語シンポジウム)
- 大語彙連続音声認識エンジンJuliusの開発の進展(Session-5, 第7回音声言語シンポジウム)
- 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価(雑音・VAD,第9回音声言語シンポジウム)
- 雑音環境下におけるNAM認識のための参照マイクを用いた雑音除去
- 雑音環境における複数モデルを用いた十分統計量に基づく教師なし(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音環境における複数モデルを用いた十分統計量に基づく教師なし話者適応(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音環境における複数モデルを用いた十分統計量に基づく教師なし話者適応(ポスターセッション)(第6回音声言語シンポジウム)
- 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価(雑音・VAD,第9回音声言語シンポジウム)
- 実環境ハンズフリー音声認識のための音響モデルと言語モデルに基づく音声区間検出と認識アルゴリズム(認識,理解,対話,一般)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討
- 音声情報案内システム「たけまるくん」および「キタちゃん」の開発(特別企画「音声認識デベロッパーズフォーラム」)
- 実環境における子供音声認識のための音韻モデルおよび教師なし話者適応の評価(音声言語)
- 実環境音声情報案内システムにおける環境雑音及び不要発話の識別
- 大人・子供に適応した音声情報案内のためのユーザ自動識別(ポスターセッション)(第5回音声言語シンポジウム)
- 大人・子供に適応した音声情報案内のためのユーザ自動識別(第5回音声言語シンポジウム : ポスターセッション)
- 大人・子供に適応した音声情報案内のためのユーザ自動識別(第5回音声言語シンポジウム : ポスターセッション)
- 空間的サブトラクションアレーを用いたハンズフリー音声認識の高精度化
- 子供音声認識のための音響モデルの構築および適応手法の評価(ポスターセッション)(第6回音声言語シンポジウム)
- 音声対話システムにおける信頼度基準と音響基準を統合した不要音棄却
- 公共音声情報案内システム「たけまるくん」の運用および収集発話の分析(音声対話システムA)(テーマ:音声対話システム、音声言語情報処理、一般)
- 連続単語認識における認識結果の逐次早期確定アルゴリズムの評価(認識アルゴリズム,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 音声対話システムのためのキーワードの共起制約に基づくスポッティングアルゴリズムの評価(対話,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 連続単語認識における認識結果の逐次早期確定アルゴリズムの評価(認識アルゴリズム,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 音声対話システムのためのキーワードの共起制約に基づくスポッティングアルゴリズムの評価(対話,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- コードブックを用いた実時間処理CMNの実装と評価
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 母音区間情報を用いた実時間ケプストラム平均正規化(CMN)の検討(特徴量, 区間検出)
- 子供音声認識における年齢層を考慮した音響モデルおよび適応手法の評価
- 信頼度基準デコーディングを用いた高効率な単語グラフ生成法
- 連続音声認識ソフトウェアJulius(研究のツールボックス(2))
- 子供音声認識のための音響モデルの構築および適応手法の評価(ポスターセッション)(第6回音声言語シンポジウム)
- 子供音声認識のための音響モデルの構築および適応手法の評価(ポスターセッション)(第6回音声言語シンポジウム)
- 登録キーワードと汎用言語モデルを用いた音声認識部・応答選択部の密結合に基づく統計的音声対話システム
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(システム・信頼度)(第5回音声言語シンポジウム)
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(第5回音声言語シンポジウム : システム・信頼度)
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(第5回音声言語シンポジウム : システム・信頼度)
- 魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent (言語理解とコミュニケーション)
- 魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent (音声)
- 魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent(オーガナイズドセッション:音声対話,第13回音声言語シンポジウム)
- 魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent(オーガナイズドセッション:音声対話,第13回音声言語シンポジウム)
- 魅力ある音声インタラクションシステムを構築するためのオープンソースツールキット MMDAgent
- キャンパスの公共空間におけるユーザ参加型双方向音声案内デジタルサイネージシステム(音声対話システムの実用化に向けて)
- 10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術(音声対話システムの実用化に向けて)
- 10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術
- キャンパスの公共空間におけるユーザ参加型双方向音声案内デジタルサイネージシステム