文脈を考慮した確率的モデルによる話し言葉の整形

スポンサーリンク

概要

論文の詳細を見る
自動音声認識 (ASR) の結果には認識誤りのみならず,言いよどみや口語的表現など,会議録にふさわしくない現象が多く含まれている.これらの現象を整形し,自然な会議録を作成するために,認識結果 (または忠実な書き起こし) と会議録を異なる言語とみなし,統計的機械翻訳を用いて認識結果から会議録へと "翻訳" する.本研究では,この枠組みの中で 2 つの手法を提案する.まず,文脈情報を考慮した翻訳モデルを導入し,システムのさらなる精度向上を目指す.また,翻訳モデルの条件付き確率と同時確率の対数線形補間を行うことで,高頻度の翻訳パターンを優先的に利用することを可能とする.有限状態トランスデューサー (WFST) による実装を行い,国会会議録と音声認識結果を用いた評価実験を行った.
2009-12-14

著者

関連論文

もっと見る

スポンサーリンク