講演音声認識のための言語モデルの教師なし適応
スポンサーリンク
概要
- 論文の詳細を見る
大語彙の話し言葉音声認識における言語モデルの教師なし話者適応について報告をおこなう.講演などの話し言葉においては,話題の他に文末表現などで発話の傾向やその発音が話者間で大きく異なるため,言語・発音モデルの話者性へめ適応が必要である.本稿では,教師なし言語モデル話者適応手法として(1)認識結果を直接用いて適応する手法,及び(2)発話文単位で類似テキストを選択しそれを用いて適応する手法,を提案する.その上で発音変動のモデル化についても検討し,話者適応の枠組みに統合することで,言語表現の傾向と発音変動の両方を同時にモデル化する.実際の講演の音声認識実験において提案手法それぞれの有効性を確認した.提案手法の統合の効果も確認し,単語誤り率を4.4%改善できた.
- 社団法人電子情報通信学会の論文
- 2002-12-13
著者
-
山田 篤
Astem
-
南條 浩輝
龍谷大学
-
内元 清貴
独立行政法人 情報通信研究機構
-
河原 達也
京都大学 情報学研究科
-
南條 浩輝
京都大学 情報学研究科 知能情報学専攻
-
山田 篤
(財) 京都高度技術研究所
-
河原 達也
京都大学 学術情報メディアセンター
関連論文
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 日本語発話文の敬語の誤用を指摘するシステム(人工知能)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 日本人英語における実践的コミュニケーション能力の発達段階の分析 : 誤りが通じやすさに及ぼす影響を指標として(言語と学習)
- 言語資源の用途情報の抽出と利用(情報抽出・評判分析)
- 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
- 日英単言語Webコーパスからの対訳treebank自動獲得 (言語理解とコミュニケーション)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 統計的前編集のための対訳コーパスからの学習データの自動生成
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- テキストマイニングと社会活動のトレース
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 日本語ディクテーションのための言語資源・ツールの整備
- 日本語ディクテーションのための言語資源・ツールの整備
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウエアの概要(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))
- 擬人化音声対話エージェントツールキットGalatea
- 擬人化音声対話エージェント開発プロジェクト
- 擬人化音声対話エージェントツールキットの基本設計
- 擬人化音声対話エージェントツールキットの基本設計
- 日本語ディクテーション基本ソフトウェア(99年度版)
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 2000-NL-137-7 / 2000-SLP-31-2 日本語ディクテーション基本ソフトウェア(99年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 98年度版
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(98年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア : 97年度版
- 日本語ディクテーション基本ソフトウェア(97年度版)
- ディクテーションにおける形態素辞書エントリと読みの整備の効果
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 日本語ディクテーション基本ソフトウェア(音声処理技術のデモの紹介)
- 2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (音声)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (言語理解とコミュニケーション)
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 音声による大規模知識ベース検索のための単語重要度を考慮したベイズリスク最小化デコーディング
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- E-002 高フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減の検討(E分野:自然言語・音声・音楽,一般論文)
- 日本語ディクテーション基本ソフトウェア(97年度版)の性能評価
- 大規模な日本語話し言葉データベースを用いた講演音声認識
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 機械翻訳のための統計的手法に基づく前編集
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出
- 講演音声認識のための言語モデルの教師なし適応
- 講演音声認識のための言語モデルの教師なし適応
- 講演音声認識のための言語モデルの教師なし適応
- D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- ドキュメント翻訳のための統計的手法に基づく原言語文の自動変換
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング(音声,聴覚)
- 講演音声認識のための話題・話者・発音変動に適応した言語モデル
- 発話速度に依存したデコーディングと音響モデルの適応
- 発話速度に依存したデコーディングと音響モデルの適応、
- 発話速度に依存したデコーディングと音響モデルの適応
- 発話速度に依存したデコーディングの検討
- 講演音声認識のための話速別モデル化の検討
- 種々の大語彙連続音声認識タスクにおける認識誤りの自動診断
- 大語彙連続音声認識における認識誤り原因の自動同定
- 大語彙連続音声認識における認識誤り原因の自動同定
- クラウド時代の新しい音声研究パラダイム
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告
- 音声ドキュメント処理ワーキンググループ活動報告