講演音声認識のための音響・言語モデルの検討
スポンサーリンク
概要
- 論文の詳細を見る
融合研究プロジェクトにおいて構築が進められている講演音声と書き起こしテキストのデータベースを用いて、講演音声の認識のための音響・言語モデルを作成した。男性4名による音声・言語関係の学会講演を対象として評価を行った。これらのデータには話し言葉に固有の表現や発声の怠けなどが頻出する。利用できる講演の種類と量が多様であるため、音響・言語モデルそれぞれの学習にどのようなデータの組み合わせが適当であるかの検討を行った。音響モデルの学習には、学会講演というスタイルに一致させることの効果を確認し、言語モデルにおいても同様の傾向を確認した。現時点では平均59.8%の単語認識精度を得ることができた。
- 社団法人電子情報通信学会の論文
- 2000-12-15
著者
-
南條 浩輝
龍谷大学
-
河原 達也
京都大学大学院 情報学研究科
-
加藤 一臣
京都大学情報学研究科
-
加藤 一臣
京都大学大学院情報学研究科知能情報学専攻
-
南條 浩輝
京都大学大学院情報学研究科知能情報学専攻
関連論文
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 統計的前編集のための対訳コーパスからの学習データの自動生成
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- スライド情報を用いた言語モデル適応による講義音声認識
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 質問応答・情報推薦機能を備えた音声による情報案内システム(音声質問応答,インタラクションの理解とデザイン)
- ドメインとスタイルを考慮したWebテキストの選択による音声対話システム用言語モデルの構築(音声,聴覚)
- シナリオ記述を状況に依存して実行する対話エージェントのアーキテクチャ
- シナリオ記述を状況に依存して実行する対話エージェントのアーキテクチャ
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- 話し言葉における引用節の自動認定および引用符の付与(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
- 対話音声認識を指向した音響モデルの構築
- 発話検証に基づく音声操作プロジェクタとそれによる講演の自動ハイパーテキスト化 (音声言語情報処理)
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ (音声言語情報処理)
- 単語トレリスインデックスを用いた段階的探索による大語彙連続音声認識
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 文法カテゴリ対制約を用いたA^*探索に基づく大語彙連続音声認識パーザ
- 汎用的な情報検索音声対話プラットフォーム
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (音声)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (言語理解とコミュニケーション)
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 音声による大規模知識ベース検索のための単語重要度を考慮したベイズリスク最小化デコーディング
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- E-002 高フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減の検討(E分野:自然言語・音声・音楽,一般論文)
- 音声対話によるソフトウェアサポートタスクのための効率的な確認戦略(音声, 聴覚)
- 2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 英語韻律発音学習支援システムのための英語文強勢のモデル化と自動検出
- CALLシステムのための英語文強勢知覚のモデル化
- 大規模な日本語話し言葉データベースを用いた講演音声認識
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 話し言葉音声認識のための言語モデルとデコーダの改善
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演音声認識のための音響・言語モデルの検討
- 講演ディクテーションのための話題独立言語モデルと話題適応
- 講演ディクテーションのための話題独立言語モデルと話題適応
- 複合的言語制約に基づくキーフレーズ検出を用いた汎用的なデータベース検索音声対話プラットフォーム
- 音声言語を用いた仮想空間との対話による試着システム(次世代ヒューマンインタフェース・インタラクション)
- 音声言語を用いた仮想空間との対話による試着システム
- 京大総合情報メディアセンターにおけるCALLの試み
- 京大総合情報メディアセンターにおけるCALLの試み
- 機械翻訳のための統計的手法に基づく前編集
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出
- 講演音声認識のための言語モデルの教師なし適応
- 講演音声認識のための言語モデルの教師なし適応
- 講演音声認識のための言語モデルの教師なし適応
- D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- ドキュメント翻訳のための統計的手法に基づく原言語文の自動変換
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング(音声,聴覚)
- 講演音声認識のための話題・話者・発音変動に適応した言語モデル
- 発話速度に依存したデコーディングと音響モデルの適応
- 発話速度に依存したデコーディングと音響モデルの適応、
- 発話速度に依存したデコーディングと音響モデルの適応
- 発話速度に依存したデコーディングの検討
- 講演音声認識のための話速別モデル化の検討
- 種々の大語彙連続音声認識タスクにおける認識誤りの自動診断
- 大語彙連続音声認識における認識誤り原因の自動同定
- 大語彙連続音声認識における認識誤り原因の自動同定
- クラウド時代の新しい音声研究パラダイム
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告
- 音声ドキュメント処理ワーキンググループ活動報告