音声スタータ : "SWITCH" on Speech(自然言語情報処理研究会と一部合同開催 : マルチモーダル・音声インタフェース関連)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,非言語情報の一つである言い淀み(有声休止)を活用し,ユーザが音声認識を開始してほしいタイミング(発話区間の始端)を,言い淀むことによって明示的に指示できる「音声スタータ」という新しい音声インタフェースを提案する.通常の音声認識システムは,発話区間の切り出し後に音声認識を行うため,雑音下での切り出しミスが認識精度に悪影響を与え,頑健性を保証することが困難であった.我々は,有声休止が雑音下でも頑健に検出できると考え,常に有声休止の途中から音声認識を開始することで,信頼性の高い発話区間の検出方法を実現することを試みる.様々な雑音環境下で4種類の発話区間検出方法を比較実験した結果,音声スタータは他の検出方法に比べ,特に低SNR(10dB以下)の条件で高い性能が得られた.
- 一般社団法人情報処理学会の論文
- 2003-05-27
著者
関連論文
- 5 音楽情報学(新しい○○情報学)
- 歌唱指導による音響特徴の変化とその歌唱力評価への影響
- Hyperlinking Lyrics : 複数の楽曲の歌詞中に共通して登場するフレーズ間へのリンク作成手法(アプリケーション)
- MusicThumbnailer : 音響的特徴に基づく楽曲のサムネイル画像生成手法(アプリケーション)
- 10.初学者のための音楽情報処理ブックマーク(音楽情報処理技術の最前線)
- 5R-5 A Music Retrieval Approach from Alternative Genres of Query by Adjusting Instrument Volume
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- PodCastle: ユーザ貢献により性能が向上する音声情報検索システム
- 単一テンプレート適応法による音楽音響信号を対象としたハイハットシンバルの音源同定(音楽音響信号認識)
- AISTハミングデータベース : 歌声研究用音楽データベース