災害報道字幕制作のための言語モデル更新(安全・安心な社会を創る音声・聴覚情報処理,音声/福祉/ディジタル信号処理/聴覚一般)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,災害報道の字幕制作に向けた言語モデルの適応化手法を提案する.災害報道時は,災害そのものが前例のない新しい事象であることから,言語モデルを適応化するために十分な量の学習テキストを用意することが困難である.そこで提案する適応化手法では,入手可能な少量のオンライン原稿に加えて音声認識結果を用い,言語モデルの教師なし適応化を行う.さらに,最新の災害の状況を反映させるため,適応化を短い時間間隔で逐次的に実施する.音声認識実験では,オンライン原稿のみを用いて適応化した言語モデルと比較して,提案手法により単語誤りが8.2%削減された.
- 2013-06-06
著者
関連論文
- 単語誤り最小化に基づく識別的リスコアリングによるニュース音声認識(音声,聴覚)
- コンテンツ活用のための報道番組自動書き起こしシステム (システム開発論文特集)
- ダイレクト方式とリスピーク方式の音声認識を併用したリアルタイム字幕制作システム
- 単語誤り最小化に基づく識別的リスコアリングによる音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 放送用リアルタイム字幕制作のための音声認識技術の改善
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- D-14-8 累積音素尤度によるオンライン発話検出と男女音声認識(D-14.音声・聴覚,一般講演)