話題混合モデルによる放送ニュースからの話題抽出
スポンサーリンク
概要
- 論文の詳細を見る
放送ニュースの音声やテキストからの話題抽出は, ストーリーの分類や検索, 大語い連続音声認識における言語的制約への利用などが期待できる.本論文では, 話題抽出のための話題混合モデルを提案し, 数千の話題を対象にして, 放送ニュースの各ストーリーから関連する複数の話題を同時に抽出することを試みる.話題混合モデルは, 話題がストーリー中の単語ごとに遷移し, それぞれの単語出力確率に従って単語を出力していくというモデルである.話題混合モデルは一種のHMMであり, EMアルゴリズムによって, 各話題はその話題と関連性の深い単語(キーワード)をより多く出力するように学習される。話題抽出で問題となる, どの話題にも出現しやすい一般単語は, モデルに加えられた特別な話題によって吸収される.英語と日本語ニュースのテキストおよび音声認識結果を入力とした話題抽出実験において, 話題混合モデルは従来モデルよりも高い話題適合率を示した.
- 社団法人電子情報通信学会の論文
- 1998-09-25
著者
関連論文
- 単語誤り最小化に基づく識別的リスコアリングによるニュース音声認識(音声,聴覚)
- コンテンツ関連技術 放送における視聴覚障害者向け情報バリアフリー技術 (小特集 著作権とコンテンツ流通)
- リアルタイム字幕放送のための音声認識(福祉と音声処理,一般)
- コンテンツ活用のための報道番組自動書き起こしシステム (システム開発論文特集)
- ダイレクト方式とリスピーク方式の音声認識を併用したリアルタイム字幕制作システム
- 単語誤り最小化に基づく識別的リスコアリングによる音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 放送用リアルタイム字幕制作のための音声認識技術の改善
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)