Consolidation-based Speech Translation applied to Chinese-English Broadcast News domain
スポンサーリンク
概要
- 論文の詳細を見る
音声認識システムと機械翻訳システムを統合した音声翻訳システムでは,発話者による冗長な情報や認識誤りが含まれる音声認識結果をそのまま和訳すると性能が劣化することが知られている.本報告では,音声認識結果から誤りを排除しつつ意味のまとまりのある部分単語列を抽出するコンソリデーションという枠組みに基づく新しい音声翻訳注を提案する.一方,コンソリデーションに基づく音声翻訳は発話された全ての単語を翻訳するアプローチではないため,書き起こし文を人手により翻訳した結果を正解として評価するのは適切ではない.そこで,本研究では正解翻訳結果から文意を保持した様々な長さの部分単語列を単語ネットワークで表現し,そのネットワークから抽出される部分翻訳を正解として評価を行う枠組みを提案する.中国語ニュース音声データRT04内の発話をコンソリデーションに基づき翻訳レBLEUで評価した結果を報告する.さらにコンソリデーションの精度およびコンソリデーションに基づく翻訳の性能を評価するため,情報保持精度(IPAccy)と意味保持精度(MPAccy)を提案する.
- 2007-05-24
著者
-
Vogel Stephan
Cmu Carnegie Mellon University School Of Computer Science
-
HORI Chiori
NiCT-ATR
-
ZHAO Bing
CMU, Carnegie Mellon University, School of Computer Science
-
Waibe Alex
Cmu Carnegie Mellon University School Of Computer Science
-
Zhao Bing
Carnegie Mellon University
-
Vogel Stephan
Carnegie Mellon University
-
Waibe Alex
Carnegie Mellon Univers
関連論文
- Consolidation-Based Speech Translation and Evaluation Approach
- Consolidation-based Speech Translation applied to Chinese-English Broadcast News domain