話し言葉の整形作業における削除箇所の自動同定(音声言語処理)

スポンサーリンク

概要

論文の詳細を見る
『日本語話し言葉コーパス』(CSJ)のコアに対して、講演録の作成を想定して、削除・置換・挿入などの一次整形のアノテーションを付与した。本稿では、この話し言葉の整形作業において削除される箇所を自動推定する手法を提案する。本研究では、削除箇所についてIOB体系でラベリングを行い、このラベルについてのテキストチャンキングの問題とみなし、SVMに基づくチャンカであるYamChaを利用する。素性として、同一表現の繰り返しや文節・係り受けといった言語的情報、基本周波数などの韻律的情報などを検討し、また言い直しなどの自己修復部との関係についても調べた。書き起こしと音声認識結果の両方に対して評価実験を行い、書き起こしについてはF値0.8が得られた。
社団法人情報処理学会の論文
2008-05-15

著者

関連論文

もっと見る

スポンサーリンク