日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
スポンサーリンク
概要
- 論文の詳細を見る
「日本語ディクテーション基本ソフトウェア」は、大語=連続音声認識(LVCSR)研究・開発の共通プラットフォームとして設計・作成された。これは、複数の大学・公的研究機関の研究者の協力プロジェクトの成果である。このプラットフォームは、標準的な認識エンジン・日本語音響モデル・日本語言語モデルから構成される。音響モデルは、日本音響学会の音声データベースを用いて学習し、monophoneから数千状態のtriphoneまで用意した。語=と単語N-gram(2-gramと3-gram)は、毎日新聞記事データベースを用いて構築した。認識エンジンJULIUSは、音響モデル・言語モデルとのインターフェースを考慮して開発された。これらのモジュールを統合して、5000語=の日本語ディクテーションシステムを作成し、種々の要素技術の評価を行なった。本ツールキットは、無償で一般に公開されている。
- 一般社団法人情報処理学会の論文
- 1998-05-28
著者
-
小林 哲則
早稲田大学理工学術院
-
山本 幹雄
筑波大学システム情報工学研究科
-
山田 篤
Astem
-
武田 一哉
名大
-
鹿野 清宏
奈良先端大
-
伊藤 克亘
電総研
-
伊藤 彰則
山形大学工学部電子情報工学科
-
伊藤 彰則
東北大
-
河原 達也
京大・メディア
-
小林 哲則
早稲田大学
-
河原 達也
京大・情報学
-
武田 一哉
名大・電子情報学
-
宇津呂 武仁
奈良先端大学
-
Ito A
Graduate School Of Engineering Tohoku University
-
Akinori Ito
Graduate School Of Engineering Tohoku University
-
李 晃伸
京大
-
峯松 信明
豊橋技科大
-
山本 幹雄
沖テクノシステムズラボラトリ(株)
-
Ito Akinori
Graduate School Of Engineering Tohoku University
-
伊藤 彰則
山形大・工
-
山本 幹雄
筑波大学
-
伊藤 彰則
Graduate School of Engineering, Tohoku University
-
宇津呂 武仁
奈良先端大
関連論文
- 音声認識実用化技術の展開(総合報告)
- 複数情報の統合による人物の性別・年齢層の推定法(顔とジェスチャの認識)
- クラス距離を重みとする局所保存射影とその顔画像による年齢推定への応用(テーマ関連セッション2)
- 会話ロボットとその聴覚機能
- 音声シフト : 音高の意図的な変化を利用した音声入力インタフェース(音声, 聴覚)
- 音声シフト : "SHIFT"on Speech
- I-062 監視カメラ映像からの実時間顔検出手法の一検討(I.画像認識・メディア理解)
- 複数情報の統合による人物の性別・年齢層の推定法
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 集合知に基づく語彙情報を用いたトピック依存言語モデリング(理解)
- 対話型情報検索システムにおける提案要求表現の適応的理解(自然言語処理)
- 音声対話用音声認識システム(対話,第10回音声言語シンポジウム)
- 複数の観測列候補を扱う隠れマルコフモデルによる移動ロボット用ジェスチャ認識
- 音声・音響インタフェース(第3回)音声対話システム
- ロボットのためのハンズフリー音声認識システム(音響処理・話者同定,第10回音声言語シンポジウム)
- 集合知を利用した語彙情報の収集・共有・管理システム(音声言語処理)
- Proxy-Agentを用いた音声認識対応ウェブアプリケーション開発フレームワークの提案と実装(音声基盤技術・インタフェース)
- 視線運動の離散性を用いた視線認識(テーマ関連セッション2)
- 視線運動の離散性を用いた視線認識(テーマ関連セッション2,顔・ジェスチャの認識・理解)
- マルチモーダル会話ロボット : ロボットが会話において行う「聴く」行為について
- プロキシエージェントアーキテクチャによる音声認識アプリケーション用ユーザモニタリング機能の効率化(セッション2 : 理解るインタフェース : 音声+ソーシャル+コミュニティ)
- 対話ロボットの動作に頑健な頭部ジェスチャ認識(画像認識,コンピュータビジョン)
- MONEA : 効率的多機能ロボット開発環境を実現するメッセージ指向ネットワークロボットアーキテクチャ
- 対話調整的役割を果たす顔表情の認識(テーマセッション, 顔・ジェスチャーの認識・理解)
- D-5-5 対話ロボットのための発話権保持者に依存した視線制御モデル(D-5. 言語理解とコミュニケーション, 情報・システム1)
- 肯定的/否定的発話態度の認識とその音声対話システムへの応用(音声, 聴覚)
- 人間形会話ロボット : パラ言語の生成・理解機能を持つマルチモーダルインタフェース
- 音声対話ロボットROBISUKEによる相談型対話の実現(音声対話システムB)(テーマ:音声対話システム、音声言語情報処理、一般)
- 動作中の対話ロボットにおける頭部ジェスチャ認識(顔とジェスチャの認識)
- パラ言語の理解能力を有する対話ロボット
- 自律型ロボットの行動を介した言語獲得
- カーナビにおける音声インタフェースの評価 : 語彙外発話の状況と対応案に関して(聴覚・音声・言語とその障害,一般)
- 10 サーバ連携に基づく継続的な音声認識応用システム開発(音声認識技術の実用化への取り組み)
- サーバ連携に基づく継続的な音声認識応用システム開発 (特集 音声認識技術の実用化への取り組み)
- ライブストリーミングのための協調的音声書き起こしシステム
- アイコンタクト機能を有する複数ユーザとの対話ロボット
- マルチモーダル入力環境下における音声の協調的利用 : 音声作図システムS-tgifの設計と評価
- 音声利用効果の経時変化と顔向認識による不要発話の棄却 : マルチモーダル作図システムS-tgifにおける評価
- マルチメディアインタフェースにおける音声対話
- 音声・マウス・キーボードを併用した作図システムS-tgifとその評価
- 音声・マウス・キーボードを用いたマルチモーダル作図システム
- 複数情報の統合による人物の性別・年齢層の推定法(顔とジェスチャの認識)
- マルチカーネル学習を用いた話者認識における最適化の検討
- 最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識
- 座談会 : 音声研究を語る : (小特集:)
- 第3回 音声対話システム
- 集合知を利用した語彙情報サービスにおける自動語彙拡張の評価
- 音声対話用音声認識システム(対話,第10回音声言語シンポジウム)
- ロボットのためのハンズフリー音声認識システム(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声対話用音声認識システム(対話,第10回音声言語シンポジウム)
- ロボットのためのハンズフリー音声認識システム(音響処理・話者同定,第10回音声言語シンポジウム)
- 集合知を利用した語彙情報の収集・共有・管理システム(音声言語処理)
- Proxy-Agentを用いた音声認識対応ウェブアプリケーション開発フレームワークの提案と実装(音声基盤技術・インタフェース)
- 視線運動の離散性を用いた視線認識(テーマ関連セッション2,顔・ジェスチャの認識・理解)
- プロキシエージェントアーキテクチャによる音声認識アプリケーション用ユーザモニタリング機能の効率化(セッション2 : 理解るインタフェース : 音声+ソーシャル+コミュニティ)
- 最小相対エントロピー識別学習へのラティスによる仮説表現と並列化可能な最適化手法の導入
- 最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識
- HMMの尤度パターンを利用したリスコアリングにおける次元圧縮法の検討(認識,理解,対話,一般)
- マクロな時間構造を持つテンプレート群からの確率的距離を用いた階層型音声認識(認識,理解,対話,一般)
- 特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合(第8回音声言語シンポジウム)
- 特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合
- 特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- 特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- 特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合
- 特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合
- 減算型アレイ処理とスペクトラルサブトラクションを用いた音源分離技術とその携帯電話への応用(認識・理解・対話・一般)
- シミュレーションに基づく音声認識システム評価の妥当性の検証(認識・理解・対話・一般)
- マイク間のスペクトル強度比を利用した音源定位におけるHLDA利用の効果(耐雑音, 音源分離, ロボット)
- 参照信号によるパーミュテーション問題解決とSMDPの統合による周波数領域BSSの性能向上(耐雑音, 音源分離, ロボット)
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識実用化技術の展開
- コミュニケーション活性化を指向した会話ロボット : 通所介護施設における事例(テーマセッション,福祉と見守りのための画像・音声処理)
- コミュニケーション活性化を指向した会話ロボット : 通所介護施設における事例(テーマセッション,福祉と見守りのための画像・音声処理)
- コミュニケーション活性化を指向した会話ロボット : 通所介護施設における事例(テーマセッション,福祉と見守りのための画像・音声処理)
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 単語・クラス統計の融合と汎用コーパスの選択的利用に基づく小規模目的タスクコーパスからの頑健な言語モデル作成法(音声情報処理 : 現状と将来技術論文特集)
- クラス統計と単語統計の併用による小規模学習データのための統計的言語モデル構成法
- クラス統計と単語統計の併用による小規模学習データのための統計的言語モデル構成法
- 大語彙連続音声認識における連鎖語の追加による語彙拡大の効果 (音声言語情報処理)
- 統計的言語モデルにおける高頻度形態素連鎖の辞書登録に関する一考察
- アイコンタクト機能を有する複数ユーザとの対話ロボツト
- 距離感を与える音声の特徴分析と合成(一般(ポスターセッション),第11回音声言語シンポジウム)
- 距離感を与える音声の特徴分析と合成(一般(ポスターセッション),第11回音声言語シンポジウム)
- 5U-8 集合知を利用した語彙情報収集・共有・管理システム(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- Dempster-Shafer理論を用いた音声・画像情報の統合による個人認識システム
- Dempster-Shafer理論を用いた音声・画像情報の統合による個人認識システム
- Dempster-Shafer理論を用いた音声・画像情報の統合による個人認識システム
- 顔画像認識における学習部分空間法を用いた新規利用者のオンライン登録
- ARPAにおける音声認識プロジェクト
- ALICE: 会話環境における言語獲得 : 言語移植のための音声言語システムの弱指導学習
- ウェブベースの分散型音声認識アプリケーション開発プラットフォームに関する一提案
- マルチモーダルロボット用マルチプロセッサアーキテクチャ
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価