マルチモーダルインタラクションによるニュース映像中の人物認識(<特集>システム論文特集号)

概要

論文の詳細を見る
近年,インターネットが爆発的に普及したが,我々が情報を得る情報源としては,依然としてテレビニュース等に依るところが大きい。しかし,テレビニュースのみでは,ある事柄に関する深い情報を入手することは困難である。このため,テレビに対して直接質問して詳細な情報を検索できる対話型テレビの出現が望まれる。このような対話型テレビは,ユーザから様々な情報検索要求を受けることが想定されるが,本論文では,映像中の人物に関する情報検索に焦点を据える。対話型テレビは人間と機械との対話システムの一つであり,システムに質問する際には,キーボードなどの入力デバイスを意識することのないユーザインタフェースの採用が望ましい。このようなインタフェースとして,本研究では,ユーザにマイクの存在を意識させない,ハンズフリー音声認識を用いる。また,質問をした際に,その質問が隣で一緒にテレビを視聴している人に対してなのか,システムに対してなのかを判断することは,音声認識のみでは難しい。よって,本論文では質問と同時に,画面上の人物を指し示すことにより,システムに対する質問であることを確定させる。つまり,音声と,指先指示を利用したマルチモーダル・インタラクションを実現する。システムは,マルチモーダル・インタラクションを通じてユーザからの質問を受けた後,指定された人物の顔を認識することによって,人物の情報を検索し,ユーザに提示する。
2006-03-01

マルチモーダルインタラクションによるニュース映像中の人物認識(<特集>システム論文特集号)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク