連続音声認識コンソーシアム2000年度版ソフトウエアの概要と評価
スポンサーリンク
概要
- 論文の詳細を見る
連続音声認識コンソーシアム(CSRC)は、IPAプロジェクトで開発された「日本語ディクテーション基本ソフトウェア」の維持・発展をめざして、情報処理学会音声言語情報処理研究会のもとで活動を行っている。本稿では、2000年度(2000年10月ー2001年9月)において開発されたソフトウエアの概要を述べる。今回、大語彙連続音声認識エンジンJuliusの機能拡張、大規模なデータベースを用いた音響モデルの作成、種々の音響・言語モデル及びツール群の整備を行った。本ソフトウエアは現在、有償で頒布している。
- 一般社団法人情報処理学会の論文
- 2001-10-19
著者
-
三村 正人
京都大学学術情報メディアセンター
-
武田 一哉
名大
-
鹿野 清宏
奈良先端大
-
伊藤 克亘
電総研
-
伊藤 彰則
山形大学工学部電子情報工学科
-
李 晃伸
奈良先端大
-
伊藤 彰則
東北大
-
河原 達也
京大・メディア
-
河原 達也
京大・情報学
-
武田 一哉
名大・電子情報学
-
Ito A
Graduate School Of Engineering Tohoku University
-
伊藤 彰則
東北大学
-
Akinori Ito
Graduate School Of Engineering Tohoku University
-
住吉 貴志
京大
-
三村 正人
ASTEM
-
Ito Akinori
Education Center For Information Processing Tohoku University
-
Ito Akinori
Graduate School Of Engineering Tohoku University
-
伊藤 彰則
山形大・工
-
伊藤 彰則
Graduate School of Engineering, Tohoku University
関連論文
- 会議録作成支援のための国会審議の音声認識システム (画像符号化・映像メディア処理レター特集)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- 実走行車内音声認識の評価データベースCENSREC-3とその共通評価ベースライン
- 4L-2 空間的サブトラクションアレーに基づくハンズフリー音声認識システムの開発(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- 4L-1 話者方位推定に基づくリアルタイム発話区間検出システムの開発(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- 高齢者話者音声の認識
- HMM 合成と MLLR による環境適応アルゴリズムの評価
- 大語彙連続音声認識における高齢者向け音響モデルの評価
- 4L-3 ハンズフリーロボット対話実験システムの構築(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- 3L-7 大語彙連続音声認識ソフトウェアJuliusのマイコンへの実装(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 国会音声認識システムの音響・言語モデルの半自動更新
- 座談会 : 音声研究を語る : (小特集:)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応
- ベイズ推論を用いた連続音声からの言語モデル学習
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- 音声認識用統計的言語モデルのための形態素解析済みテキストの後処理
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- SIMOモデルに基づくICAとバイナリマスク処理を用いた2段ブラインド音源分離手法
- 日本語ディクテーションのための言語資源・ツールの整備
- 日本語ディクテーションのための言語資源・ツールの整備
- 連続音声認識コンソーシアム2002年度版ソフトウエアの概要
- 連続音声認識コンソーシアム2001年度版ソフトウエアの概要
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- ディクテーションにおける形態素辞書エントリと読みの整備の効果
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(音声処理技術のデモの紹介)
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 会議録作成支援のための国会審議の音声認識システム(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 連続音声認識コンソーシアム2000年度版ソフトウエアの概要と評価
- 多数話者音声データベースを用いた音響モデルの評価
- 2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
- ディクテーションと対話音声認識における音響モデルの差異
- 対話音声認識を指向した音響モデルの構築
- パネル討論音声の話者と話題に関する自動インデキシングの検討
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習
- 既知雑音重畳を用いたフレームベース減算型残響抑圧処理の評価
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- 多重極展開を用いた急峻な距離減衰特性を持つマイクロホンシステムの提案
- 受聴者の頭部の動きを考慮したトランスオーラルシステムの検討
- 受聴者の頭部周辺制御を目的とした音場再現システムのための逆フィルタの検討
- ダクトのANCにおける多チャンネル化の効果に関する実験的検討
- 境界要素法を用いたアクティブ防音塀の設計手法に関する基礎的検討
- 最小ノルム解を利用した逆フィルタ設計のトランスオーラルシステムへの応用
- 境界音場制御の原理に基づいたアクティブ防音塀の基礎的検討
- 知覚による口形素定義に基づくコーパスベース発話顔画像合成
- STRAIGHTスペクトルパラメータの2次元DCTに基づく量子化に関する検討
- HMMに基づく損失したゲインパラメータの補間に関する検討
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 「読み」情報に基づく高被覆率言語モデルを用いた大語彙連続音声認識
- 「読み」を考慮した言語モデルによる大語彙連続音声認識
- 応答音相殺技術に基づくバージインフリー音声対話インタフェースを用いた音声認識
- SIMOモデル信号の抽出と適応ビームフォーマを用いたブラインド音源分離の評価
- 初期フィルタ自己生成器を導入したSIMO-ICAの性能評価
- 日本人による英語フレーズ音声の韻律的特徴の分析
- 微弱体内伝導音抽出による無音声認識
- 日英言語間における声質変換と母音の影響に関する検討
- ブラインド音源分離を用いた車室内音声認識
- ケプストラム領域での音源情報入れ換えによる食道発声音声の改善の効果
- NAMから通常音声への変換における基本周波数推定の検討
- 雑音環境下におけるNAM認識のための参照マイクを用いた雑音除去
- 国内における音声データベースの現状 : 開発,管理及び音声研究への利用
- 移動マイクロホンアレーを用いた残響下における音源位置推定
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習(音声,聴覚)
- ディクテーションにおける日本語の特質を考慮した単語正解率判定ツール
- 最尤推定尺度によるN-gramのタスク適応
- 形態素解析結果の後処理により改良された統計的言語モデルの評価
- 大語彙連続音声認識のための読み上げ文コーパスの構築
- 大語彙連続音声認識のための読み上げ文の選択
- 大語彙連続音声認識研究のためのテキストデータ処理
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- N-gram 確率のタスク文法による部分強化アルゴリズムの評価
- 自動ラベリングの音韻尤度に基づく音響モデルの改善
- Juliusを用いた自由発話の自動ラベリングにおけるラベル尤度の統計的分析
- 自動読唇の実現に向けた分析フレーム間隔および画像解像度に関する調査
- 音声の長時間スペクトル特性を考慮した適応形マイクロホンアレーによる音声認識
- 混合正規分布モデルに基づく声質変換法の日英言語間への適用
- 仮想音場再生と多点受音を利用したバージインフリー音声対話システム
- 音場再現システムにおける環境変化に適応的なオンライン逆フィルタ緩和手法の評価
- グルメレシピタスクにおける音声対話エージェントを用いた Web 検索システム
- 英語学習者の発音評価手法における話者適応技術の適用
- 音源方位情報を利用した高速収束ICAアルゴリズムによるセミブラインド移動音源分離
- 調波成分の瞬時周波数を利用したピッチ推定方法の提案
- STRAIGHTの分析合成パラメータの主観評価による検討
- Kurtosis 基準による最適な死角制御型ビームフォーマ選択処理の評価
- ICAとビームフォーミングを統合した高速収束アルゴリズムに基づく3音源以上のブラインド音源分離
- 空間的サブトラクションアレーを用いたハンズフリー音声認識の高精度化
- 音声対話システムにおける信頼度基準と音響基準を統合した不要音棄却
- ささやき声の音声認識におけるMLLRに基づく話者適応の評価
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応(音声,聴覚)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応
- 2A1-Q07 ハイブリッドシステムモデルに基づくモデル予測型前方車追突回避アシストシステムの設計(【交通・物流部門】自動車分野におけるロボティクス)