PodCastleの実現 : Web 2.0に基づく音声認識性能の向上について(セッション2 : 理解るインタフェース : 音声+ソーシャル+コミュニティ)

スポンサーリンク

概要

論文の詳細を見る
本稿では,ポッドキャストを検索できるWebサービス「PodCastle」を実現するための音声認識手法について述べる.ポッドキャストでは多様な内容が異なる環境で録音されており,多数の未知語を含む新たな話題も多いため,従来の音声認識システムで適切に認識するのは困難だった.この問題を解決するために,本研究では,Web 2.0によって得られる様々なデータを用いることによって,継続的に,音声認識システムを改善していく.具体的には,各ポッドキャストの内容に応じた言語モデルの話題適応,Web 2.0のサービスを通じた単語発音の自動獲得,PodCastle上でユーザが音声認識誤りを訂正した結果を用いた未知語の学習等を試みた,実際にポッドキャストを対象とした認識実験を行い,性能向上に有効であることを確認した.
2007-02-09

著者

関連論文

もっと見る

スポンサーリンク