単語抽出による音声要約文生成法とその評価

概要

論文の詳細を見る
本論文では,音声認識結果から発話単位で要約文を生成する音声自動要約手法を提案する.本手法は,原文の文字数を基準とする任意の割合(要約率)を指定して,音声認識結果から単語を抽出し接合することにより要約文を生成する.抽出された部分単語列に対し,要約文としての適正を示す尺度として要約スコアを定義する.この要約スコアを最大とする部分単語列を動的計画法により決定し,自動要約文とする.要約スコアは,要約文中の各単語の単語重要度(重要度スコア),認識時における音響的・言語的信頼度(信頼度スコア),及び要約文内の単語連鎖の言語ゆう度(言語スコア)の累積スコアによって定義される.更に,本論文では提案手法により生成された自動要約文に対し,被験者が単語抽出により作成した正解要約文を基準とする要約文の評価尺度を提案する.すなわち,被験者の作成した正解要約文を単語ネットワークを用いて表現し,ネットワーク上で自動要約文に最も類似している単語列に対し,単語正解精度を要約正解精度として評価する.音声自動要約実験としてNHKのニュース音声を大語彙連続音声認識(LVCSR)システムを用いて音声認識し,20,40,60,70,80%の5段階の要約率で提案手法により自動要約した結果を報告する.更に,その自動要約文を正解要約文単語ネットワークにより評価した結果を示す.実験結果より,自動生成された要約文が,すべての要約率で発話内容を端的に表す重要な情報を保持しつつ,冗長または不要な情報を削減できることを示す.
社団法人電子情報通信学会の論文
2002-02-01

単語抽出による音声要約文生成法とその評価

スポンサーリンク

概要

著者

関連論文

スポンサーリンク