話し言葉音声認識のための言語モデルとデコーダの改善
スポンサーリンク
概要
- 論文の詳細を見る
講演音声のような話し言葉を認識するための言語モデルとデコーダ(音声認識プログラム)の改善法について述べる。言語モデルについては、話し言葉コーパスのデータ量不足を補うために、他のコーパスと混合する方法、特に混合重みの最適化手法を考察する。また話し言葉では、ポーズで区切られる単位が言語的な単位と一致しないため、間役詞とあわせて扱いの検討が必要である。特に発話のセグメンテーションが容易でないため、ショートポーズを検出しながら逐次確定していく方式をデコーダJuliusに実装した。10名の講演音声の認識で評価を行い、平均65.3%の認識精度を得た。
- 一般社団法人情報処理学会の論文
- 2001-05-31
著者
関連論文
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 実環境における頑健な音声認識のための音韻モデルの教師なし話者適応(音声,聴覚)
- 十分統計量を用いた教師なし話者適応および環境適応(音声言語情報処理とその応用)
- MLLRを用いた音響モデルの教師なし環境雑音適応アルゴリズム
- 十分統計量に基づく教師なし環境話者適応におけるスペクトルサブトラクションの効果
- 十分統計量を用いた教師なし話者・環境適応の評価
- 高齢者音響モデルによる大語彙連続音声認識
- 十分統計量と話者距離を用いた音韻モデルの教師なし学習法
- スペクトルサブトラクションを用いた十分統計量に基づく環境・話者適応
- 十分統計量を用いた音韻モデルの教師なし学習における話者選択法の検討
- 高齢者音声の認識
- 充足統計量と話者距離を用いた教師なし話者適応学習法
- 環境雑音適応アルゴリズムの大語彙連続音声認識による評価
- 高齢者向け音響モデルによる大語彙連続音声認識の評価
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 相補的バックオフを用いた言語モデル融合ツールの構築
- Webからの音声認識用言語モデル自動生成ツールの開発
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- Juliusを用いた学内案内ロボット用音声対話システムの作成
- Juliusを用いた学内案内ロボット用音声対話システムの作成
- Juliusを用いた学内案内ロボット用音声対話システムの作成
- スペクトルサブトラクションを用いた十分統計量に基づく環境・話者適応
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 統計的前編集のための対訳コーパスからの学習データの自動生成
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 実環境研究プラットホームとしての音声情報案内システムの運用(音声,聴覚)
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 相補的バックオフを用いた言語モデル融合ツールの構築
- 2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
- 音声認識エンジンJulius/JulianのAPI実装
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (音声)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (言語理解とコミュニケーション)
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 音声による大規模知識ベース検索のための単語重要度を考慮したベイズリスク最小化デコーディング
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- E-002 高フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減の検討(E分野:自然言語・音声・音楽,一般論文)
- AS-4-4 実環境下における多段独立成分分析の音声認識評価(AS-4. 多チャンネル音響信号処理, 基礎・境界)
- ブラインド音源分離とサブバンド除去処理を用いた車室内音声認識
- ブラインド音源分離とサブバンド除去処理を用いた車室内音声認識
- 大規模な日本語話し言葉データベースを用いた講演音声認識
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 機械翻訳のための統計的手法に基づく前編集
- マイクロホンアレーを用いた自律移動型ロボットにおける話者位置推定
- マイクロホンアレーを用いた自律移動型ロボットにおける話者位置推定
- 雑音環境における複数モデルを用いた十分統計量に基づく教師なし(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音環境における複数モデルを用いた十分統計量に基づく教師なし話者適応(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音環境における複数モデルを用いた十分統計量に基づく教師なし話者適応(ポスターセッション)(第6回音声言語シンポジウム)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出
- 講演音声認識のための言語モデルの教師なし適応
- 講演音声認識のための言語モデルの教師なし適応
- 講演音声認識のための言語モデルの教師なし適応
- D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- ドキュメント翻訳のための統計的手法に基づく原言語文の自動変換
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング(音声,聴覚)
- 講演音声認識のための話題・話者・発音変動に適応した言語モデル
- 発話速度に依存したデコーディングと音響モデルの適応
- 発話速度に依存したデコーディングと音響モデルの適応、
- 発話速度に依存したデコーディングと音響モデルの適応
- 発話速度に依存したデコーディングの検討
- 講演音声認識のための話速別モデル化の検討
- 種々の大語彙連続音声認識タスクにおける認識誤りの自動診断
- 大語彙連続音声認識における認識誤り原因の自動同定
- 大語彙連続音声認識における認識誤り原因の自動同定
- クラウド時代の新しい音声研究パラダイム
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告
- 音声ドキュメント処理ワーキンググループ活動報告