音声認識エンジンJulius/JulianのAPI実装

概要

論文の詳細を見る
我々が開発した音声認識エンジンJulius/Julianをアプリケーション開発者にとって利用しやすいものにするため、音声認識におけるAPIの仕様を考察し、SAPI 5.0の実装を行った。その結果、認識エンジンの入出力が標準化され、各種モデルの切り換えが容易に行えるようになり、SAPIのアプリケーションにおいて Julius/Julianの統計的言語モデルと記述文法による音声認識機能が利用できるようになった。これらの成果物は連続音声認識コンソーシアム(CSRC)^1において配布している。また Julius/Julianを統合し、複数の文法を処理する試みも行った。
一般社団法人情報処理学会の論文
2001-07-13

著者

李晃伸
奈良先端科学技術大学院大学情報科学研究科
河原達也
京都大学情報学研究科
住吉貴志
京大
住吉貴志
京都大学情報学科

関連論文

ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
モデル駆動アーキテクチャに基づくホームネットワークサービスの開発支援(学生セッション A_モデル指向(1))
実環境における頑健な音声認識のための音韻モデルの教師なし話者適応(音声,聴覚)
十分統計量を用いた教師なし話者適応および環境適応(音声言語情報処理とその応用)
MLLRを用いた音響モデルの教師なし環境雑音適応アルゴリズム
十分統計量に基づく教師なし環境話者適応におけるスペクトルサブトラクションの効果
十分統計量を用いた教師なし話者・環境適応の評価
高齢者音響モデルによる大語彙連続音声認識
十分統計量と話者距離を用いた音韻モデルの教師なし学習法
スペクトルサブトラクションを用いた十分統計量に基づく環境・話者適応
十分統計量を用いた音韻モデルの教師なし学習における話者選択法の検討
高齢者音声の認識
充足統計量と話者距離を用いた教師なし話者適応学習法
環境雑音適応アルゴリズムの大語彙連続音声認識による評価
高齢者向け音響モデルによる大語彙連続音声認識の評価
相補的バックオフを用いた言語モデル融合ツールの構築
Webからの音声認識用言語モデル自動生成ツールの開発
話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
局所的な係り受けと韻律の素性を用いた話し言葉の節・文境界推定(話し言葉処理)
日本語CALLシステムの音声認識における効果的な予測のための決定木に基づく誤りパターンの分類(一般(ポスターセッション),第9回音声言語シンポジウム)
日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化
『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
点予測と系列予測の2段階化による品詞推定の精度向上
点予測と系列予測の2段階化による品詞推定の精度向上
スロットベースのベクトル空間モデルの組合せによる音声書籍検索
ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
Juliusを用いた学内案内ロボット用音声対話システムの作成
Juliusを用いた学内案内ロボット用音声対話システムの作成
Juliusを用いた学内案内ロボット用音声対話システムの作成
スペクトルサブトラクションを用いた十分統計量に基づく環境・話者適応
頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
ポッドキャストを対象とした音リアクションイベント検出
「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
異種コｰパスの組合せによるトリガｰ言語モデルの構築
異種コーパスの組合せによるトリガー言語モデルの構築
異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
Webからの情報抽出を用いた音声対話システム
文脈を考慮した確率的モデルによる話し言葉の整形
重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
国会音声認識システムの音響・言語モデルの半自動更新
NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
点予測による形態素解析
文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
Spoken Term Detectionのためのテストコレクション構築とベースライン評価
Spoken Term Detectionのためのテストコレクション構築とベースライン評価
文脈を考慮した確率的モデルによる話し言葉の整形(音声検索・要約,第11回音声言語シンポジウム)
会議音声認識におけるBICに基づく高速な話者正規化と話者適応
ベイズ推論を用いた連続音声からの言語モデル学習
スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
実環境研究プラットホームとしての音声情報案内システムの運用(音声,聴覚)
カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要(プロジェクト紹介(2))(第5回音声言語シンポジウム)
連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
相補的バックオフを用いた言語モデル融合ツールの構築
音声認識エンジンJulius/JulianのAPI実装
AS-4-4 実環境下における多段独立成分分析の音声認識評価(AS-4. 多チャンネル音響信号処理, 基礎・境界)
ブラインド音源分離とサブバンド除去処理を用いた車室内音声認識
ブラインド音源分離とサブバンド除去処理を用いた車室内音声認識
大規模な日本語話し言葉データベースを用いた講演音声認識
話し言葉音声認識のための言語モデルとデコーダの改善
話し言葉音声認識のための言語モデルとデコーダの改善
マイクロホンアレーを用いた自律移動型ロボットにおける話者位置推定
マイクロホンアレーを用いた自律移動型ロボットにおける話者位置推定
雑音環境における複数モデルを用いた十分統計量に基づく教師なし(ポスターセッション)(第6回音声言語シンポジウム)
雑音環境における複数モデルを用いた十分統計量に基づく教師なし話者適応(ポスターセッション)(第6回音声言語シンポジウム)
雑音環境における複数モデルを用いた十分統計量に基づく教師なし話者適応(ポスターセッション)(第6回音声言語シンポジウム)
タスク文法によるN-gram確率の部分強化を用いた認識アルゴリズムの評価
スペクトルサブトラクションと雑音重畳を併用した十分統計量に基づく話者適応
雑音に頑健な音韻モデルと教師なし話者適応
雑音に頑健な音韻モデルと教師なし話者適応
雑音に頑健な音韻モデルと教師なし話者適応
自動読唇における分析フレーム間隔および画像解像度に関する調査
自動読唇における分析フレーム間隔および画像解像度に関する調査
自動読唇における分析フレーム間隔および画像解像度に関する調査
実環境における子供音声認識のための音韻モデルおよび教師なし話者適応の評価(音声言語)
実環境音声情報案内システムにおける環境雑音及び不要発話の識別
大人・子供に適応した音声情報案内のためのユーザ自動識別(ポスターセッション)(第5回音声言語シンポジウム)
大人・子供に適応した音声情報案内のためのユーザ自動識別
子供音声認識のための音響モデルの構築および適応手法の評価(ポスターセッション)(第6回音声言語シンポジウム)
公共音声情報案内システム「たけまるくん」の運用および収集発話の分析(音声対話システムA)(テーマ:音声対話システム、音声言語情報処理、一般)
信頼度基準デコーディングを用いた高効率な単語グラフ生成法
連続音声認識ソフトウェアJulius(研究のツールボックス(2))
子供音声認識のための音響モデルの構築および適応手法の評価(ポスターセッション)(第6回音声言語シンポジウム)
生駒市コミュニティセンター音声情報案内システムの開発と運用
子供音声認識のための音響モデルの構築および適応手法の評価(ポスターセッション)(第6回音声言語シンポジウム)
2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(システム・信頼度)(第5回音声言語シンポジウム)
2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(第5回音声言語シンポジウム : システム・信頼度)
2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(第5回音声言語シンポジウム : システム・信頼度)

音声認識エンジンJulius/JulianのAPI実装

スポンサーリンク

概要

著者

関連論文

スポンサーリンク