音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用

概要

論文の詳細を見る
音声入力型の情報検索では検索クエリ中の重要語句を正確に認識する必要があり,それらの認識誤りを少なくすることが重要である.しかし,従来の音声情報検索においては尤度最大化音声認識が用いられており,単語誤りについて考慮されていない.そこで本研究では,単語誤り率の最小化を行うベイズリスク最小化音声認識を音声入力による大学情報検索システムに導入した.本手法の有効性を示すために評価実験を行った結果,従来の尤度最大化音声認識に比べてベイズリスク最小化音声認識により音声認識精度ならびに検索精度を改善することができた.
2011-05-09

著者

南條浩輝
龍谷大学
山本誠一
同志社大学
山本誠一
同志社大学工学部
山本誠一
同志社大学理工学部
西田昌史
同志社大学
南條浩輝
龍谷大理工
松尾宏規
同志社大学
古谷遼
龍谷大学理工学部
松尾宏規
同志社大学大学院工学研究科
南條浩輝
龍谷大
西田昌史
同志社大学理工学部

関連論文

音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
D-14-3 日本語母語話者用英語言語モデルのための学習データ選択手法の検討(D-14. 音声,一般セッション)
D-14-2 英語音響モデル・言語モデルへの話者適応化の検討(D-14. 音声,一般セッション)
多重タグ付き英語学習者コーパスの開発と英語能力自動測定への応用
英語コミュニケーション能力の自動測定技術の提案
D-14-10 日本語母語話者のための英語音声認識システムの検討(D-14. 音声,一般セッション)
日本語母語話者のための英語音声認識システム用英語言語モデルの検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
D-15-39 英語表現能力評価尺度の一検討(D-15. 教育工学,一般セッション)
英語学習者コーパスの開発と英語表現能力評価尺度の検討(ユビキタス学習環境/一般)
D-15-31 英語音響モデルによる日本人英語能力判定手法の検討(D-15.教育工学,一般講演)
D-15-25 日本人英語学習者による日英翻訳コーパスの開発(D-15.教育工学,一般講演)
単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
非負値行列因子分解に基づく多人数会話における話者分類
単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
日本語母語話者のための英語音声認識システム用英語言語モデルの検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
日本語母語話者のための英語音声認識システム用英語言語モデルの検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
Web上のテキスト情報と翻訳モデルを利用した翻訳品質評価法の検討(翻訳・多言語化)
Web 上のテキスト情報と翻訳モデルを利用した翻訳品質評価法の検討
WWW上のテキスト情報を利用した翻訳品質評価法の検討
複数の編集距離を用いた口語翻訳文の自動評価
携帯型端末を用いた音声自動翻訳システムとフィールド実験
音声信号処理と音声言語処理(若手研究者育成レクチャー, 合成, 生成, 韻律, 一般)
機械翻訳システム評価法の最前線
英語能力測定のための空所補充問題の自動生成手法(言語の学習・教育)
音声翻訳技術開発の経験に基づく外国語能力評価法の提案
コーパスベース音声翻訳用評価セット選択方法の提案(自然言語処理)
機械学習を用いた発話スタイル依存音響モデル自動選択による対話音声認識
機械学習を用いた発話スタイル依存音響モデル自動選択の検討
LE-4 トピック依存の訳語選択(E. 自然言語・文書)
Spoken Term Detection のためのテストコレクション構築とベースライン評価
統計的前編集のための対訳コーパスからの学習データの自動生成
NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
NMFに基づくクラスタリングを適用したAnchor Modelによる話者認識
異なる認識単位の認識器から得られた信頼度を素性に用いた音声認識
音声中の検索語検出のためのテストコレクション構築 : 中間報告
SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
単語並び換えモデルを考慮した統計的階層句機械翻訳システム
単語並び換えモデルを考慮した統計的階層句機械翻訳システム
Spoken Term Detectionのためのテストコレクション構築とベースライン評価
Spoken Term Detectionのためのテストコレクション構築とベースライン評価
最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
異なる認識単位の認識器から得られた信頼度を素性に用いた音声認識 (音声)
NMFに基づくクラスタリングを適用したAnchor Modelによる話者認識 (音声)
異なる認識単位の認識器から得られた信頼度を素性に用いた音声認識 (言語理解とコミュニケーション)
Spoken Term Detection のためのテストコレクション構築とベースライン評価
音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
統計的前編集のための対訳コーパスからの学習データの自動生成 (音声)
統計的前編集のための対訳コーパスからの学習データの自動生成 (言語理解とコミュニケーション)
音声中の検索語検出のためのテストコレクション構築 -中間報告-
単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
音声による大規模知識ベース検索のための単語重要度を考慮したベイズリスク最小化デコーディング
音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
E-002 高フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減の検討(E分野:自然言語・音声・音楽,一般論文)
大規模な日本語話し言葉データベースを用いた講演音声認識
話し言葉音声認識のための言語モデルとデコーダの改善
話し言葉音声認識のための言語モデルとデコーダの改善
講演音声認識のための音響・言語モデルの検討
講演音声認識のための音響・言語モデルの検討
講演音声認識のための音響・言語モデルの検討
機械翻訳のための統計的手法に基づく前編集
談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(第5回音声言語シンポジウム : 言語モデル・要約)
談話標識と話題語に基づく統計的尺度による講演からの重要文抽出(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
談話標識と話題語に基づく統計的尺度による講演からの重要文抽出
講演音声認識のための言語モデルの教師なし適応
講演音声認識のための言語モデルの教師なし適応
講演音声認識のための言語モデルの教師なし適応
D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用
講演の書き起こしに対する統計的手法を用いた文体の整形
ドキュメント翻訳のための統計的手法に基づく原言語文の自動変換
音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング(音声,聴覚)
講演音声認識のための話題・話者・発音変動に適応した言語モデル
発話速度に依存したデコーディングと音響モデルの適応
発話速度に依存したデコーディングと音響モデルの適応、
発話速度に依存したデコーディングと音響モデルの適応
発話速度に依存したデコーディングの検討
講演音声認識のための話速別モデル化の検討
種々の大語彙連続音声認識タスクにおける認識誤りの自動診断
大語彙連続音声認識における認識誤り原因の自動同定
大語彙連続音声認識における認識誤り原因の自動同定
クラウド時代の新しい音声研究パラダイム
音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
音声ドキュメント処理ワーキンググループ活動報告
音声ドキュメント処理ワーキンググループ活動報告

音声入力型大学情報検索システムに対するベイズリスク最小化音声認識の適用

スポンサーリンク

概要

著者

関連論文

スポンサーリンク