単語trigramを用いた大語彙連続音声認識
スポンサーリンク
概要
- 論文の詳細を見る
大語彙連続音声認識システムの性能は,音響モデルだけではなく,使用する言語モデルの性能にも大きく依存する.本研究では,言語モデルとして日本語で初めて,マルチパスアプローチによって単語trigramを適用した.語彙を7000語に限定した上で,日経新聞約5年分のテキストから言語モデルを学習し,不特定話者の音声を用いた新聞文章の読み上げタスクによって評価を行った結果,従来の単語trigram言語モデルを用いた場合より誤り率が約44%削減され,単語正解精度で約90%の性能を得ることが出来た.
- 一般社団法人情報処理学会の論文
- 1996-12-12
著者
-
古井 貞煕
Nttヒューマンインタフェース研究所
-
松岡 達雄
Nttマルチメディアビジネス開発部
-
松岡 達雄
Ntt
-
松岡 達雄
NTTヒューマンインタフェース研究所
-
大附 克年
日本電信電話株式会社NTTサイバースペース研究所
-
吉田 航太郎
東京工業大学
-
大附 克年
早大・理工
-
大附 克年
NTTヒューマンインタフェース研究所
-
大附 克年
マイクロソフトディベロップメント株式会社
関連論文
- いま, 音響学がおもしろい
- 2. 各分野における技術の変遷 : 2-7 音声認識(あの技術は今… : 技術の変遷と21世紀への展望)
- 声の個人性の話 (<小特集>声質:音声言語の多様性に迫る)
- 最尤推定法を用いたHMM適応化法
- 1994 ARPA Human Language Technology Workshop参加報告
- 4-4 話者認識(4.応用技術)(最近の音声処理技術)
- 音声認識における話者適応化技術
- 話者照合におけるモデルとしきい値の更新法
- 4)話者認識研究の現状と展望([マルチメディア情報処理研究会 ネットワーク映像メディア研究会]合同)
- テキスト指定型話者認識
- 合成HMMによる環境適応型話者認識法
- 音韻・話者独立モデルによる話者照合尤度の正規化
- VQ ひずみ,離散/連続 HMM によるテキスト独立形話者認識法の比較検討
- 音源・声道特徴を用いたテキスト独立形話者認識
- 1991年音響・音声・信号処理国際会議(ICASSP91)報告
- 1990年音声言語処理国際会議
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 話題構造抽出に基づく会議音声インデクシングシステム(音声,聴覚)
- 自由発声中の連続数字音声認識
- 雑音と歪みを含んだ音声へのHMM適応化手法の評価
- 音韻ラベルを用いない HMM 評価法とそれを用いた連続音声認識用 HMM の評価
- 番号案内を対象とした大語い連続音声認識アルゴリズム
- フレーム間相関を利用した音韻 HMM による音声認識
- 音声認識の言語処理技術 (音声認識の最新技術)
- 音声認識の音響処理技術 (音声認識の最新技術)
- 4)話者認識研究の現状と展望([マルチメディア情報処理研究会 ネットワーク映像メディア研究会]合同)
- 話者照合におけるモデルとしきい値の更新法
- テキスト選択に基づくタスク依存言語モデル構築の検討
- 大規模データベースを用いたタスク依存言語モデル構築の検討
- VQコードのBigramで制約した音韻HMMによる音声認識
- CTI向け自由発話対応音声対話システムRexDialog
- 関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
- 関連語彙獲得に基づく認識辞書のオフライン教師なし適応(音声・音響処理)
- D-14-11 音声認識結果の単語系列の言語的妥当性に基づく正誤判定(D-14. 音声・聴覚)
- 話題構造抽出に基づく会議音声インデクシング
- N-bestに基づく話者適応化法の検討
- N-bestに基づく教師なし話者適応化法
- 音声認識のためのN-bestに基づく話者適応化
- 連続数字音声認識における音響モデル学習法の検討
- 連続数字音声における音響モデル学習法の検討
- 識別誤り最小化による話者適応化法の検討
- テキストコーパスを用いた音声理解のための言語モデル自動獲得
- 音声情報処理とヒューマンインタフェース (学会誌50巻を迎えて)
- 音声の個人性情報と話者認識
- 音素認識誤り傾向の統計的分析法に関する一考察
- N-best候補を用いた話題抽出の検討
- ニュース音声を対象とした連続音声認識に基づく話題抽出
- ニュース音声を対象とした大語彙連続音声認識と話題抽出
- ニュース音声を対象とした大語彙連続音声認識
- 高次n-gramを用いた大語彙連続音声認識の検討
- 新聞記事データベースを用いた大語い連続音声認識
- テキストコーパスを用いた音声理解のための言語モデル自動獲得
- 統計的翻訳言語モデルを用いた音声理解
- 単語trigramを用いた大語彙連続音声認識
- 統計的翻訳言語モデルを用いた音声理解
- 単語trigramを用いた大語彙連続音声認識
- 音声理解のための言語モデル自動獲得
- 新聞記事読み上げタスクを用いた大語彙連続音声認識における音響モデルの検討
- 新聞読み上げタスクを用いた大語彙連続音声認識における言語モデルの検討
- テキストコーパスを用いた音声理解のための言語モデル自動獲得
- 新聞記事を用いた大語彙連続音声認識の検討
- 大語彙連続音声認識を用いた音声・映像コンテンツのインデクシング
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- ニュース音声認識のための言語モデルと音響モデルの検討
- ニュース音声認識のための言語モデルと音響モデルの検討
- ニュース音声認識のための言語モデルと音響モデルの検討
- 書き起こし想定発話の音声認識における言語モデルの検討
- 時間非同期ビーム探索に基づく第二パスを用いた連続音声確認(音声処理技術のデモの紹介)
- 統計的音韻中心の推定とそのHMMによる評価
- 統計的音韻中心における音韻の特徴分析
- D-14-19 ニュースコンテンツにおける音響信号自動判別の検討
- F-4 概念ベクトルによるトピックセグメンテーションのニュース音声への適用(音声・音声言語情報処理,F.音声・音楽)
- ニュース音声認識の話者適応法の検討
- ニュース音声認識における言語モデルの改良
- 音声認識エンジンVoiceRexを用いたリハビリ所見入力用音声ワープロ
- 音声認識エンジンVoiceRexによるニュース放送音声認識
- 音声認識エンジンVoiceRexによる文書作成--連続音声認識機能を用いた音声ワープロ (特集 ここまできた音声認識・音声合成)
- 適応音響モデルを用いた放送ニュース音声認識
- 新聞記事を用いた大語彙連続音声認識の検討
- 音声理解のための言語モデル自動獲得の検討
- マルコフモデルによる文仮説の再編成
- IVTTA94会議報告
- 不特定話者認識
- マルチメディア時代を支える音声認識技術 (特集論文 メディア処理技術)
- 音声認識エンジンVoiceRexの開発
- 音声認識エンジンVoiceRexを開発--幅広い応用に対応できる音声認識ソフトウェア (特集 ここまできた音声認識・音声合成)
- 大語彙連続音勢認識研究用日本語コーパス : JNAS
- 大語彙連続音声認識のための読み上げ文コーパスの構築
- 大語彙連続音声認識のための読み上げ文の選択
- 大語彙連続音声認識研究のためのテキストデータ処理
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- 大語彙連続音声認識研究のためのテキストデータ整備
- テキストコーパスを用いた音声理解のための言語モデル自動獲得