パーソナルロボットPaPeRoにおける音声インタフェース(<特集>システム論文特集号)

概要

論文の詳細を見る
パーソナルロボットPaPeRoにおける音声インタフェースの実現と性能評価について報告する。音声インタフェースは,話者方向推定,ノイズキャンセラ,エコーキャンセラから構成される。話者方向推定は,近接音場を想定した方向推定手法を用いて,話者の口とマイクロホンの高低差による誤差を解消している。ノイズキャンセラは,広範囲なSN比を想定したステップサイズ制御により,高い雑音消去性能と小さな音声歪を両立することができる。エコーキャンセラは,背景雑音の推定を行うことにより,ダブルトーク検出性能を向上させている。実環境評価により,話者方向推定の正解率が40%,音声認識率が,雑音環境下で最大65%,ロボット発話時最大71%改善できることを示す。音声インタフェースに対する音声認識システムの最適化は全く行っておらず,この音声インタフェースはそのまま他の音声認識システムにも適用できる汎用性を有している。この音声インタフェースの一部は,2005年愛知にて開催された愛・地球博において,チャイルドケアロボットとして技術実証運用を行った。
社団法人日本音響学会の論文
2006-03-01