連続単語音声認識結果の読み系列を利用した辞書未登録語の音声文書検索(認識,理解,対話,一般)
スポンサーリンク
概要
- 論文の詳細を見る
マルチメディアコンテンツ利用機会の増加に伴い,ユーザが見たい場面を容易に検索できる機能が求められる.この機能の実現手法として,音声区間を音声認識し検索キーワードの含まれる区間を特定する方式が研究されているが,音声認識に用いる単語辞書に未登録の言葉は検索が困難であるという問題がある.本稿では,音声認識結果に付加される単語の読み系列を利用することで,辞書未登録語であっても検索可能とする新たなアプローチを提案する.提案方式では,クエリとして辞書未登録語が入力されると,音声認識結果からクエリと類似する読み系列が含まれる区間を類似度に従って高い順位のものから候補文書として出力する.この際,サブワード間音響距離を照合時局所距離として用いることで検索精度の向上を図り,さらに候補文書に対する再認識処理を行うことで一層の検索精度の向上を図った.評価実験では,サブワード間音響距離,再認識処理を用いることで検索性能の向上を確認した.サブワード列照合方式と比べ同等の検索精度が得られ,本手法の有効性を示した.
- 社団法人電子情報通信学会の論文
- 2008-07-10
著者
-
石亀 昌明
岩手県立大学ソフトウェア情報学部
-
伊藤 慶明
岩手県立大学ソフトウェア情報学部
-
田中 和世
筑波大学大学院図書館情報メディア研究科
-
小嶋 和徳
岩手県立大学
-
李 時旭
産業技術総合研究所
-
小嶋 和徳
岩手県立大学ソフトウェア情報学部
-
田中 和世
筑波大学図書館情報メディア研究科
-
田中 和世
筑波大学 大学院図書館情報メディア研究科
-
栗城 吾央
岩手県立大学ソフトウェア情報学部
-
伊藤 慶明
岩手県立大
-
石亀 昌明
岩手県立大学
-
田中 和世
筑波大学大学院 図書館情報メディア研究科
-
栗城 吾央
岩手県立大学ソフトウェア情報学研究科
関連論文
- マルチモーダル情報処理の研究動向(マルチモーダル)
- 筋電位を利用したサポートベクターマシンによる手のリアルタイム動作識別(福祉工学)
- 脳波情報及び印象評価結果に基づく音楽コード進行パターン自動生成プログラムの作成
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 語彙フリー音声文書検索手法における新しいサブワードモデルとサブワード音響距離の有効性の検証(音声言語)
- 軽い音声認識システムの開発と課題(若手研究者育成レクチャーシリーズ,認識,理解,対話,一般)
- 並列分散遺伝的アルゴリズムにおける多層リング型トポロジの探索性についての考察
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- 3T-1 毒キノコ識別支援ツールのための毒キノコ判定方式の検討(検出・抽出,学生セッション,人工知能と認知科学)
- 階層サーバ・クライアント型モデルによる非同期並列分散遺伝的アルゴリズム