キーワードスポッティングを用いた情報検索システムにおける拡張辞書の効果
スポンサーリンク
概要
- 論文の詳細を見る
音声入力により放送ニュースに対して情報検索を行うシステムについて検討している.その前処理として, 比較的自由度の高いユーザの問い合わせに対して, 頑健な音声認識が可能なシステムを目指している.ユーザの語彙辞書の作成方法としてニュース音声の書き起こし結果を利用している.本研究では, まず学習データと評価データの時期差の問題を解決するために, 最新のWebのニュース記事からN-gram言語モデルを作成し, 評価データに適応した.また未知語を補う方法として情報検索で広く使われている単純類似度法やLSI法を用いて検討した.これにより, 未知語に対して若干の効果を確認することができた.次に, キーワードスポッティングのシミュレーション実験を行い, システムの有効性を示した.
- 社団法人電子情報通信学会の論文
- 2002-01-18
著者
関連論文
- Hyperlinking Lyrics : 複数の楽曲の歌詞中に共通して登場するフレーズ間へのリンク作成手法(アプリケーション)
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 音響・言語モデルの適応処理によるスポーツ実況中継の音声認識(音声,聴覚)
- 音響・言語適応処理を用いたスポーツ実況中継音声の認識 : ハイライトシーン検出への応用
- 集合知に基づく語彙情報を用いたトピック依存言語モデリング(理解)
- PodCastle--ポッドキャスト音声認識のための集合知を活用した音響モデル学習
- ポッドキャスト音声認識の性能向上手法 : 集合知によって更新されるWebキーワードを活用した言語モデリング(学生セッション I)
- ポッドキャストを対象とした類似エピソード検索手法(学生セッション I)
- 有声・無声休止区間の自動検出を考慮したデコーディングによる自由発話音声認識の性能改善(音声,聴覚)
- ライブストリーミングのための協調的音声書き起こしシステム