単語トレリスインデックスを用いた大語彙連続音声認識エンジンJULIUS
スポンサーリンク
概要
- 論文の詳細を見る
段階的探索アルゴリズムで広く用いられている単語グラフ形式は, 入力音声を単語単位で決定的に区分化するため単語対近似の導入が必須であり, 特に大語彙で処理量の増大が著しい。一方トレリス形式は単語境界の非決定性を保持できるが, 探索空間を直接的に限定できない。これに対し本稿では, トレリス形式を拡張した単語トレリスインデックス形式を提案し, 大語彙での高精度かつ高効率の探索を実現する。5, 000語の毎日新聞記事読み上げタクスにおいて, 提案手法を実装した認識エンジンJULIUSを用いて認識実験を行った結果, 認識精度が1.6%改善された。さらに第1パスでより強い近似である1-best近似を用いた場合, メモリ効率を10倍以上改善しながら第2パスでは従来手法とほぼ同等の認識精度が得られた。最後に単語間音素環境依存を考慮した最終的な単語認識精度は91.4%を達成した。
- 1998-04-23
著者
関連論文
- 「WCC98に参加して/IFIP TC : この1年」
- 遺伝アルゴリズムを用いたBPNモデルの構造及び学習パラメタの探索
- 話し言葉における引用節の自動認定および引用符の付与(第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与
- フレーズスポッティングと意味解析の密結合による頑健な音声言語理解
- 音声理解システムにおける制約緩和法の検討
- 会話音声中の単語スポッティングのための音語モデルの検討
- 対話システムにおける知識の相違および認識誤りの解消
- スライド情報を用いた言語モデル適応による講義音声認識
- 質問応答・情報推薦機能を備えた音声による情報案内システム(音声質問応答,インタラクションの理解とデザイン)
- ドメインとスタイルを考慮したWebテキストの選択による音声対話システム用言語モデルの構築(音声,聴覚)
- シナリオ記述を状況に依存して実行する対話エージェントのアーキテクチャ
- シナリオ記述を状況に依存して実行する対話エージェントのアーキテクチャ
- 遠隔講義機器設定タスクにおける発話内容の抽象化
- 調音位置・調音方式の識別に基づく発音学習支援システム
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語対制約をヒューリスティックとするA^*探索に基づく会話音声認識
- 対話音声認識を指向した音響モデルの構築
- パネル討論音声の話者と話題に関する自動インデキシングの検討
- 音声対話に基づく知的情報検索システム
- 音声対話システムのための対話の認知プロセスモデル
- F0パターンに基づく講義音声の文単位へのセグメンテーション
- 発話検証に基づく音声操作プロジェクタとそれによる講演の自動ハイパーテキスト化 (音声言語情報処理)
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ (音声言語情報処理)
- 4U-5 自動アーカイブ化のための講義音声の区分化
- 対話コーパスにおける発話単位タグの一推定手法
- 複数のコーパスを用いたドメイン独立フィラー言語モデルの構成
- 大語彙連続音声認識エンジンJULIUSの高精度化と高速化
- 単語トレリスインデックスを用いた段階的探索による大語彙連続音声認識
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 講義の自動アーカイブ化のための韻律情報を用いた講義音声の文境界の抽出
- 日本語モーラリズム習得支援システム : 調音法に基づいたリズムパターンテンプレートの設定
- 有限状態文法に基づく大語彙連続音声認識におけるA*探索法の評価
- 音声対話によるソフトウェアサポートタスクのための効率的な確認戦略(音声, 聴覚)
- 2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 英語韻律発音学習支援システムのための英語文強勢のモデル化と自動検出
- CALLシステムのための英語文強勢知覚のモデル化
- フレーズスポッティングに基づく頑健な音声理解
- 遠隔講義・会議での利用を目的とした音声によるAV制御システムの作成
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 音声言語を用いた仮想空間との対話による試着システム(次世代ヒューマンインタフェース・インタラクション)
- 音声言語を用いた仮想空間との対話による試着システム
- 音声言語を用いた仮想空間との対話による試着システム
- 音声言語を用いた仮想空間との対話による試着システム (言語・音声理解と対話処理研究会(第18回)テ-マ:一般)
- 対話システムにおける知識の相違および認識誤りの解消
- 目的指向型対話における対話交渉モデル
- 対話による協調的問題解決のモデリング
- 文頭からの意味的区切りの抽出による意味表現の生成
- 断片的発話からの増進的な意味解析
- 概念階層構造を持つネットワークを用いた漸進的音声言語理解
- 会話スタイル依存の言語モデルを用いたキーフレーズの検出・検証
- 会話スタイル依存の言語モデルを用いたキーフレーズの検出・検証
- 会話スタイル依存の言語モデルを用いたキーフレーズの検出・検証
- 音声操作プロジェクタのためのドメイン独立フィラーモデルの評価
- 発話検証用モデルを用いた音声操作プロジェクタ
- 話し言葉依存の競合言語モデルを用いたキーフレーズの検出・検証
- 音声操作プロジェクタを用いた講義音声・テキストのハイパ-メディア化 (第20回言語・音声理解と対話処理研究会(SIG-SLUD))
- ヒューリスティックな言語モデルを用いた会話音声中の単語スポッティング
- 対話データベースへの意味情報の付与
- 模擬対話データのデータベース化と事例ベース意味解析の適用
- 音声対話データの収録と意味的情報の統計的分析
- 構文主義A^*探索による音声認識における未知語の処理
- A^*探索に基づいたフレーズスポッティングによる頑健な音声理解
- フレーズスポッティングに基づく頑健な音声理解
- 自由発話認識・理解のためのフレーズスポッティング
- 単語の共起情報を用いたニュース朗読音声の話題同定機構
- キーワードスポッティングに基づくニュース音声の話題同定
- 声質の感性的評価の処理モデル
- 音声・マウス・キーボードによるマルチモーダル作図システム
- 顔画像特徴, 歩行画像特徴および音声特徴の統合による個人識別
- 大語彙連続音声認識に適した語彙の再構成
- 発語内行為タグの推定法とそのタグ付与支援ツ-ルへの組み込み
- 対話コ-パスに対する意味・談話タグの推定手法
- 図像情報を利用した講演調音声のディクテーション
- 協調的対話におけるシステムの理解度に応じた発話生成
- マルチエージェント分散対話スケジューリングシステムにおけるマシン対マシン通信プロトコルの設計
- 対話事例ベースによる発話内容の推定および未知語の解析
- 音声理解のための統計的フレーズ言語モデルの自動構築
- フレ-ズ単位の統計的言語モデルによる音声対話理解 (言語・音声理解と対話処理研究会(第17回))
- 声質に関する印象評価および心理的類似性と音響的類似性について
- 単語N-gramと段階的探索を用いた大語彙連続音声認識
- 単語トレリスインデックスを用いた大語彙連続音声認識エンジンJULIUS
- 単語N-gramと段階的探索に基づく大語彙連続音声認識エンジンJULIUS
- キーフレーズ検出・検証のためのタスク独立・会話スタイル依存フィラーモデル
- 音声・言語・概念の統合的処理による対話の理解と生成 (「音声対話」)
- A^*探索に基づく大語彙連続音声認識
- 人工知能の将来像 : 21世紀の情報科学のフロンティアとしての知能科学
- 1. 音声言語情報処理研究の動向と研究課題 (<解説> 音声言語情報処理の現状と研究課題)
- 人工知能の新たなる発展を願って