音声認識とメタデータを利用した映像検索システムの開発
スポンサーリンク
概要
- 論文の詳細を見る
蓄積された大量の映像データから所望の映像を高速に検索するための方式として、予め音声チャンネルから音声認識によりメタデータを自動生成しておき、このメタデータに対して入力したキーワードの検索、特定シーン映像を頭だし再生する映像検索システムを試作した。メタデータ生成部では、入力音声からCV/VCラティスの時系列データを生成し、メタデータとしてMPEG2-TSストリーム中にPESパケットとしてVideoとAudioのPESパケットとともに多重化する。メタデータ検索部では、DPマッチングを用いてCV/VCラティスを時系列データとし、入力キーワードとの照合処理を行うことにより検索を行う。ニュース番組を想定した文を対象として検索実験を行った結果、約80%の検出率を得た。
- 社団法人電子情報通信学会の論文
- 1999-07-15
著者
-
遠藤 充
松下技研株式会社
-
星見 昌克
松下技研株式会社
-
遠藤 充
松下技研(株)
-
江村 恒一
松下電器産業株式会社ネットワーク開発センター
-
江村 恒一
松下電器産業株式会社 東京通信システム研究所
-
遠藤 充
松下電器産業株式会社先端技術研究所ヒューマンウェア研究所
-
遠藤 充
松下技研(株) ヒューマンインタフェース研究所
-
古山 浩志
松下電器産業 (株) 東京通信システム研究所
-
八塩 仁
松下電器産業 (株) 東京通信システム研究所
-
井上 郁夫
松下電器産業 (株) 東京通信システム研究所
-
星見 昌克
松下技研 (株) 情報・ネットワーク研究所
-
古山 浩志
松下技研株式会社
関連論文
- A*探索を用いた連続音声認識方法の検討
- 音声による文例検索方法の検討
- 未知語の処理方法の検討
- 日英通訳テレビ電話システムの試作
- 単語共起モデルの評価
- 単語タイプライタを用いた文音声認識法における高速化の検討
- 単語共起と単語Bigramによる制約を用いた文認識法の検討
- 隠れマルコフモデルに基づくインタラクティブな仮想カメラワーク遷移制御
- ATM SW方式ビデオサーバにおけるストリーム送信制御方式の検討及び実装結果
- ビデオサーバにおける多重特殊再生の検討
- 音声翻訳のための認識誤りにロバストな類似用例選択手法の評価
- 音声翻訳のための認識誤りにロバストな類似用例選択手法の評価
- (1)PDAで動作する旅行会話向け音声翻訳システムのインタフェース評価(携帯端末のためのインタフェース)
- B-20-38 監視カメラの設置環境に依存しない不審者自動検出の検討(B-20. ユビキタス・センサネットワーク,一般セッション)
- 語彙変更が容易な不特定話者用小型音声認識ボード
- 音素対の線形判別結果を確率論的に統合した音素認識法の検討
- モデル音声法におけるスペクトル歪み対策法の検討
- モデル音声法における話者適応方式の検討
- 音素の特徴点に着目した大語彙不特定話者音声認識法
- 1チップDSPで作動する実用的な不特定話者音声認識法
- 音素の特徴点に着目した不特定話者音声認識法の検討
- 音素の特徴点に着目した不特定話者音声認識法
- 単音節認識を用いた大語彙辞書検索システムの検討
- 個人差の小さい音素類似度ベクトルを用いた不特定話者用音声認識法
- MPEG-7 標準化動向
- 音声認識とメタデータを利用した映像検索システムの開発
- 音声認識とメタデータを利用した映像検索システムの開発
- 音声認識とメタデータを利用した映像検索システムの開発
- MPEG-7概要、標準化および応用動向
- 電話音声におけるスペクトル歪み対策法の検討
- オフィス向け音声ダイアルの検討
- 登録型英語用モデル音声法の検討
- 音声認識を用いた映像検索システム - キーワード検索率の改善 -
- 音声認識を用いた映像検索システム - 音声認識と読唇の統合 -
- 1L-3 唇周辺画像からの唇抽出方式の検討
- 映像データの音声チャンネルを利用したフリーキーワード検索システムの開発
- 唇周辺のマークを用いた音素認識のための基礎検討
- 映像提示による単音節の音声知覚
- 単音節の音声知覚における視覚情報と聴覚情報の関係
- 音声認識システムにおける単語共起モデルを用いた言語処理法の検討