談話標識の抽出に基づいた講演音声の自動インデキシング(<特集>音声言語情報処理とその応用)

スポンサーリンク

概要

論文の詳細を見る
講演音声において話題(セクション)の転換点で用いられる特徴的な単語(談話標識)を用いて,自動インデキシングを行う方法を提案する.本研究では,種々の講演の中でも流れが比較的明確で共通性のある学会講演を対象とする.学習データの講演の書き起こしからポーズ情報を用いてセクション境界候補を検出し,統計的言語モデルを用いて句点を挿入して,各セクションの先頭の1文を抽出する.その中に含まれる名詞から単語頻度と文頻度に基づいて談話標識を選定する.これらの過程は人手によるタグを必要としない教師なし学習により行われる.評価データの各文について談話標識の単語頻度と文頻度の統計量に基づく評価値を計算し,その合計が閾値以上であればインデックスを付与する。実際の講演音声の書き起こしと音声認識結果に対して評価を行った結果,再現率85%程度(適合率は20%程度)の精度でインデキシングできることを示す.
一般社団法人情報処理学会の論文
2002-07-15

著者

関連論文

もっと見る

スポンサーリンク