大語彙連続音声認識エンジンJulius ver.4(システム,第9回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
大語彙連続音声認識エンジンJuliusは2007年12月にバージョンver. 4がリリースされた.7年ぶりのメジャーバージョン更新となるver. 4では,内部構造のモジュール化およびソースの全面的な再構成が行われ,可搬性と柔軟性が大幅に向上された.その結果,エンジン本体がライブラリ化された他のアプリケーションに組み込めるようになったほか,コールバック・プラグイン等の外部との連携の仕組みが整備され,機能の拡張や構成の変更が容易に行えるようになった.言語モデルも単語N-gramおよび文法を単一バイナリで同等に扱えるようになりJulianはJuliusに統一された.さらに,複数の言語モデルと音響モデルを任意に組み合わせて,1エンジンで並列認識を行うマルチデコーディングも可能となった.また,基本性能についても拡張と強化が行われた.言語モデルとして孤立単語認識が新たに追加されたほか,4-gram以上の任意長N-gramへの対応、ユーザ関数による外部言語制約の組込み、GMM-based VADおよびデコーダベースVAD、confusion networkの生成など大幅な機能強化が行われた。性能は従来バージョンと同等を維持しており、かつメモリ量の削減も行われている。
- 社団法人電子情報通信学会の論文
- 2007-12-13
著者
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 音声認識のデコーダと認識エンジン(自動音声認識研究の動向と展望)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
- 実環境における頑健な音声認識のための音韻モデルの教師なし話者適応(音声,聴覚)
- 信頼度基準による解探索打ち切りに基づく超早音声認識
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 複数の音素決定木構造を含む統計モデルに基づく音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 複数の音素決定木構造を含む統計モデルに基づく音声認識(ポスターセッション,第10回音声言語シンポジウム)
- HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 複数の音素決定木構造を含む統計モデルに基づく音声認識(ポスターセッション,第10回音声言語シンポジウム)
- HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
- 4L-3 ハンズフリーロボット対話実験システムの構築(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- 3L-7 大語彙連続音声認識ソフトウェアJuliusのマイコンへの実装(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 3L-1 音声情報案内システム「たけまるくん」の運用(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価(雑音・VAD,第9回音声言語シンポジウム)
- 音声対話システムのためのN-gramに基づくキーワードからの文生成(対話,第11回音声言語シンポジウム)
- 音声対話システムのためのN-gramに基づくキーワードからの文生成(対話,第11回音声言語シンポジウム)
- 音声対話システムにおける発話文の自動クラスタリングに基づく応答選択(話し言葉処理)
- 音素決定木構造のアニーリングに基づく音響モデリング(聴覚・音声/一般)
- フレーム単位の信頼度を用いた並列音声認識におけるデコーダ間枝刈りの検討(音声認識)
- ユーザ生成型音声対話コンテンツを用いた音声情報案内システム(一般(ポスターセッション),第11回音声言語シンポジウム)
- ユーザ生成型音声対話コンテンツを用いた音声情報案内システム(一般(ポスターセッション),第11回音声言語シンポジウム)
- ロボットにおける音声認識技術
- 実環境研究プラットホームとしての音声情報案内システムの運用(音声,聴覚)
- 複数の特徴量による条件付確率場に基づく音声区間検出(韻律・VAD,第11回音声言語シンポジウム)
- 音声認識のための非線形スペクトル変換を用いた話者適応(音響モデル,第11回音声言語シンポジウム)
- 複数の特徴量による条件付確率場に基づく音声区間検出(韻律・VAD,第11回音声言語シンポジウム)
- 音声認識のための非線形スペクトル変換を用いた話者適応(音響モデル,第11回音声言語シンポジウム)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 既知雑音重畳を用いたフレームベース減算型残響抑圧処理の評価
- AS-4-4 実環境下における多段独立成分分析の音声認識評価(AS-4. 多チャンネル音響信号処理, 基礎・境界)
- 3L-6 大語彙連続音声認識エンジンJuliusバージョン4.0の構成と機能(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 大語彙連続音声認識エンジンJulius ver.4(システム,第9回音声言語シンポジウム)
- 大語彙連続音声認識エンジンJulius ver. 4(システム,第9回音声言語シンポジウム)
- 大語彙連続音声認識エンジンJulius ver.4(システム,第9回音声言語シンポジウム)
- 大語彙連続音声認識エンジンJuliusの開発の進展(Session-5, 第7回音声言語シンポジウム)
- 大語彙連続音声認識エンジンJuliusの開発の進展(Session-5, 第7回音声言語シンポジウム)
- 大語彙連続音声認識エンジンJuliusの開発の進展(Session-5, 第7回音声言語シンポジウム)
- 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価(雑音・VAD,第9回音声言語シンポジウム)
- 雑音環境下におけるNAM認識のための参照マイクを用いた雑音除去
- 雑音環境における複数モデルを用いた十分統計量に基づく教師なし(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音環境における複数モデルを用いた十分統計量に基づく教師なし話者適応(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音環境における複数モデルを用いた十分統計量に基づく教師なし話者適応(ポスターセッション)(第6回音声言語シンポジウム)
- 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価(雑音・VAD,第9回音声言語シンポジウム)
- 実環境ハンズフリー音声認識のための音響モデルと言語モデルに基づく音声区間検出と認識アルゴリズム(認識,理解,対話,一般)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討
- 音声情報案内システム「たけまるくん」および「キタちゃん」の開発(特別企画「音声認識デベロッパーズフォーラム」)
- 実環境における子供音声認識のための音韻モデルおよび教師なし話者適応の評価(音声言語)
- 実環境音声情報案内システムにおける環境雑音及び不要発話の識別
- 大人・子供に適応した音声情報案内のためのユーザ自動識別(ポスターセッション)(第5回音声言語シンポジウム)
- 大人・子供に適応した音声情報案内のためのユーザ自動識別(第5回音声言語シンポジウム : ポスターセッション)
- 大人・子供に適応した音声情報案内のためのユーザ自動識別(第5回音声言語シンポジウム : ポスターセッション)
- 空間的サブトラクションアレーを用いたハンズフリー音声認識の高精度化
- 子供音声認識のための音響モデルの構築および適応手法の評価(ポスターセッション)(第6回音声言語シンポジウム)
- 音声対話システムのためのN-gramに基づくキーワードからの文生成
- 音声対話システムにおける信頼度基準と音響基準を統合した不要音棄却
- 公共音声情報案内システム「たけまるくん」の運用および収集発話の分析(音声対話システムA)(テーマ:音声対話システム、音声言語情報処理、一般)
- 連続単語認識における認識結果の逐次早期確定アルゴリズムの評価(認識アルゴリズム,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 音声対話システムのためのキーワードの共起制約に基づくスポッティングアルゴリズムの評価(対話,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 連続単語認識における認識結果の逐次早期確定アルゴリズムの評価(認識アルゴリズム,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 音声対話システムのためのキーワードの共起制約に基づくスポッティングアルゴリズムの評価(対話,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- コードブックを用いた実時間処理CMNの実装と評価
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 母音区間情報を用いた実時間ケプストラム平均正規化(CMN)の検討(特徴量, 区間検出)
- 子供音声認識における年齢層を考慮した音響モデルおよび適応手法の評価
- 信頼度基準デコーディングを用いた高効率な単語グラフ生成法
- 連続音声認識ソフトウェアJulius(研究のツールボックス(2))
- 子供音声認識のための音響モデルの構築および適応手法の評価(ポスターセッション)(第6回音声言語シンポジウム)
- 子供音声認識のための音響モデルの構築および適応手法の評価(ポスターセッション)(第6回音声言語シンポジウム)
- 登録キーワードと汎用言語モデルを用いた音声認識部・応答選択部の密結合に基づく統計的音声対話システム
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(システム・信頼度)(第5回音声言語シンポジウム)
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(第5回音声言語シンポジウム : システム・信頼度)
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(第5回音声言語シンポジウム : システム・信頼度)
- 魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent (言語理解とコミュニケーション)
- 魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent (音声)
- 魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent(オーガナイズドセッション:音声対話,第13回音声言語シンポジウム)
- 魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent(オーガナイズドセッション:音声対話,第13回音声言語シンポジウム)
- 魅力ある音声インタラクションシステムを構築するためのオープンソースツールキット MMDAgent
- キャンパスの公共空間におけるユーザ参加型双方向音声案内デジタルサイネージシステム(音声対話システムの実用化に向けて)
- 10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術(音声対話システムの実用化に向けて)
- 10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術