未登録語のクラス依存サブワードモデルを用いた音声認識
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,未登録語を含む音声の高精度な認識を可能とする言語モデルを提案する.単語のクラスN-gramをベースとする本言語モデルは,未登録語区間に対し,その語粟クラスの読みの統計的特徴を反映したサブワードモデルを用いる点を特徴とする.また,未登録語区間の認識結果として,クラスラベル付きの読みが与えられるため,後段の言語処理が容易になっている.本方式を日本人姓・名の両クラスに適用し検討を行った.日本人姓・名データの分析結果に基づき,サブワードモデルは,単語長(モーラ数)のガンマ分布と,自動獲得したサブワード単位のN-gramとによる統合モデルとして構築した.音声認識実験の結果,登録語として認識を行った場合とほぼ同等の精度で,未登録語の区間・読み・クラスを同定できることがわかった.
- 社団法人電子情報通信学会の論文
- 1999-12-21
著者
関連論文
- 統計的翻訳評価尺度に基づく日英翻訳文の訳質分析(機械翻訳)
- 未知固有表現を含む音声の認識([特別セッション]音声言語獲得・学習技術(2), 未知語処理)
- 複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識(音声、聴覚)
- 連続音声認識システムにおけるfactoringテーブルのコンパクト化と不要単語仮説のガーベジコレクション
- 機械翻訳によって生成された追加テキストを使った統計的言語モデルの適応
- 機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合 : 旅行会話音声における評価
- 文認識率の向上に向けたFSAとNGRAMの併用モデルによる大語彙連続音声認識
- ROVER法を用いた音声認識結果の統合と誤認識文のリジェクション
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 話題と文型の違いを同時に考慮した言語モデル適応
- サブワードモデルを用いた未登録語認識の効率的探索手法(音声言語情報処理とその応用)
- 構造化言語モデルとその実装
- 後続仮説数の管理機能を用いた単語グラフの仮説数削減
- 対話者の前発話を利用した統計的言語モデル
- 音声認識過程での発話分割のための統計的言語モデル(21世紀のグループウェア)
- クラスに依存した語彙の確率的記述に基づく階層型言語モデル
- 2つの単語クラスから生じた未登録語のサブワードモデルによる音声認識
- サブワードモデルを用いた未登録語認識における効率的探索手法
- サブワードネットワークに基づく未登録語処理を搭載したデコーダの構築
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- 中国語形態素コーパスと言語モデルの評価 : パラレルコーパスにおける日英両言語との比較
- 音声翻訳のための中国語対話コーパスの整備とその評価(マルチモーダル, コーパス・言語モデル)
- 音声翻訳のための中国語対話コーパスの整備とその評価(マルチモーダル, コーパス・言語モデル)
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 信頼度尺度に基づく音声認識誤りの検出および誤り訂正(合成, 韻律, 生成, 一般)
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 文クラスタリングによる複数言語モデルを用いた誤認識文の推定
- 大語彙連続音声認識における未知語のsub-wordモデリング手法
- パターンマッチングに基づく発話意図同定のための重要語検出方法
- 対話音声を対象とした連続音声認識システムの試作と評価
- 発話分割付実時間音声認識
- 旅行会話タスクにおけるTARSPRECの性能評価
- 異種言語知識の併用による文法的単語グラフ生成法
- 異種言語知識の併用による局所的信頼性向上
- 異種言語知識の併用による局所的信頼性向上
- 異種言語知識の併用による局所的信頼性向上
- 異種言語知識の併用による局所的信頼性向上
- 大語い連続音声認識のための単語仮説数削減
- Delayed decisionビーム探索の検討
- 単語グラフと可変長N-gramを用いた大語彙自然発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた連続音声認識法
- 言語情報を用いた教師なしのQuasi-Bayesオンライン話者適応
- 位置依存単語クラスタと頻出単語列を用いた多重クラス複合3-gram言語モデル
- ドメインの多次元性を考慮した言語モデル適応
- 句構造間の関係を反映した言語モデル
- 品詞接続特性と単語接続特性の最大事後確率推定による融合に基づく単語クラス分類
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- 複数決定木の動的順序付けに基づく発話の概念推定 (音声言語情報処理)
- 統計処理による入力文から中間表現への変換を用いた音声言語理解
- 統計的手法による認識結果から中間表現への変換を用いた音声理解システム
- 決定木を用いた発話の意味タグ推定
- 統計的処理による音声・言語理解モデル
- 中間言語表現の生成を目的とした統計的音声理解方式(音声情報処理 : 現状と将来技術論文特集)
- 語彙クラスに依存した未登録語モデルに基づく統計的言語モデル
- 対話における相手話者の前発話に対する中間言語表現を利用した言語モデル
- 未登録語のクラス依存サブワードモデルを用いた音声認識
- 未登録語のクラス依存サブワードモデルを用いた音声認識
- 中間言語表現の生成を目的とした音声理解
- 母音および無音のHMMを用いた音声始端検出法
- PARALLEL JAPANESE/ENGLISH SPEECH RECOGNITION IN ATRSPREC
- 日英音声翻訳システム「ATR-MATRIX」における音声認識部分の構造と制御方法
- 多重クラスTrigram構築のための効率的な自動クラスタリング手法
- 接続の方向性を考慮した多重クラス複合N-gram言語モデル(音声情報処理 : 現状と将来技術論文特集)
- 仮説数による誤認識箇所推定尺度の評価
- TO EXPLOIT LONG HISTORY UNIT DEPENDENCIES BY LINKGRAM LANGUAGE MODELING
- 単語の長距離依存関係を表す言語モデル Linkgram
- 未登録語のクラス依存サブワードモデルを用いた音声認識
- 品詞クラスN-gramと単語N-gramの融合言語モデル
- 品詞N-gramと単語N-gramの融合言語モデル
- 接続の方向性を考慮した多重クラスN-gram言語モデル
- 接続の方向性を考慮した多重クラス複合N-gram言語モデル
- 接続の方向性を考慮した多重クラス複合N-gram言語モデル
- 多重クラスN-gramによる効率的言語モデル表現
- 接続の方向性を考慮した多重クラスN-gramモデル