ニュース解説を対象にした音声認識の検討
スポンサーリンク
概要
- 論文の詳細を見る
NHKは平成12年度より、音声認識を利用した「ニュース7」の字幕放送を試行的に開始した。現在のところ、アナウンサーが原稿を読む部分に限定して字幕を作成しているが、「ニュース解説」に該当する音声は、そのほかの原稿が読まれる部分の音声とは性質が異なるために、認識精度が低下する傾向がみられる。そこで本稿では、「ニュース解説」の言語的な特徴と音響的な特徴を分析し、これらの特徴を考慮した認識率の改善を試みる。具体的には、記者原稿からルールにより生成した解説口調の単語列を用いた言語モデルの適応化、大量のニュース番組の書き起こしコーパスを併用した言語モデルの学習、話者適応、および、発声継続時間が短い音素に対処するための音響モデルの構造の変更を行った。これらの結果、単語正解精度が5.1%向上した。
- 一般社団法人情報処理学会の論文
- 2000-12-21
著者
-
小林 彰夫
NHK放送技術研究所
-
本間 真一
NHK放送技術研究所
-
佐藤 庄衛
NHK放送技術研究所
-
今井 亨
NHK放送技術研究所
-
安藤 彰男
NHK放送技術研究所
-
安藤 彰男
工学院大学 情報学部
関連論文
- 単語誤り最小化に基づく識別的リスコアリングによるニュース音声認識(音声,聴覚)
- 生字幕制作のための音声認識
- コンテンツ活用のための報道番組自動書き起こしシステム (システム開発論文特集)
- ダイレクト方式とリスピーク方式の音声認識を併用したリアルタイム字幕制作システム
- 単語誤り最小化に基づく識別的リスコアリングによる音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 放送用リアルタイム字幕制作のための音声認識技術の改善
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)