音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)

スポンサーリンク

概要

論文の詳細を見る
文の区切りが明確でない,一文が長くなる,文の途中に間(ポーズ)が空くなどの現象が見られる自然な話し言葉を,適切な単位に区分化する処理が求められている.筆者らは,区分化の単位として従来用いられている文や節に代わる,プロの同時通訳者が原言語からターゲット言語に変換する自然なタイミングである音声翻訳単位を提案し,同単位の特徴と,言語情報ならびに韻律情報とSVMチャンカ用いた音声翻訳単位境界の推定手法について検討を行ってきた.一方,書き言葉では,区分化の単位として,句読点が広く用いられている.本稿では,音声翻訳単位境界と句読点との関連性と,プロの通訳者が付与した音声翻訳単位境界情報と句読点情報の双方を用いた場合の音声翻訳単位境界推定への効果について述べる.日本語話し言葉コーパス(CSJ)を用いた実験おいて,句読点既知データの場合F値0.88,句読点未知データの場合F値0.86と,プロの通訳者によるF値0.84に相当する性能を達成した.
2008-12-02

著者

関連論文

もっと見る

スポンサーリンク