ビデオデータにおける指定人物の検出と追跡 : 音声部分を用いた処理
スポンサーリンク
概要
- 論文の詳細を見る
Multimedia database management and retrieving are on a world-wide demand. In particular, Object Location and Tracking (OLT) technology in time-space is a core in a search engine of a huge multimedia database and has wide applications. The final target of our research is to establish technologies which enables to locate and track specified objects in video data from the combination of audio and visual cues. As human being is one of the typical objects, as the first step of our research this paper will be focused on location and tracking of a specified person in the audio domain. This paper describes OLT project, the speaker-based segment detection and junction algorithms and evaluation experiments using the simulated dialogue data, and segment Fuzzy search algorithm and its application to detection of variable length segment.
- 一般社団法人映像情報メディア学会の論文
- 1998-11-20
著者
関連論文
- 話者認証を用いたX Window施錠システムxvlock : 開発とその評価
- 話者認証を用いたX Window 施錠システム xvlock 開発とその評価(バリアフリーインタフェース, および一般)
- Ergodic HMMを用いた未知・複数信号源クラスタリング問題の検討
- N信号源モデルに基づく音声の区分化識別問題 : 話者特徴の違いに基づく区分化音声の識別
- 音声研究の現状と課題
- 音声/非音声区間検出のための自動モデル学習法の評価(音声言語,情報処理技術のフロンティア)
- 複数時系列中の類似セグメント高速探索法 : 3つの時系列に対する実装と評価(認識,理解,対話,一般)
- 類似セグメント探索RDDS法の評価(第8回音声言語シンポジウム)
- 類似セグメント探索RDDS法の評価(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 類似セグメント探索RDDS法の評価(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声/非音声区間検出のための自動モデル学習法の評価(特徴量, 区間検出)
- 譜面情報による楽曲の特徴付けの検討
- 譜面情報による楽曲の特徴付けの検討
- 字幕表示のためのVCMLプロジェクトの研究開発の現状 : 環境情景音表示とVCML文書の木構造化
- VCML Player字幕生成のための笑い声の検出
- VCML Player 字幕生成のための笑い声の検出
- 字幕表示システムVCML Playerの新機能について
- 音声と音楽のセグメンテーションの最適化
- 音楽と音声のセグメンテーションの最適化
- SP2000-17 Cepstrum Fluxを用いた音声と音楽のセグメンテーション
- 1K-4 標本化周波数識別法の雑音下音声に対する評価
- 音声の標本化周波数の自動識別方法
- 時間拘束条件下での重畳音声分解法の高速化(認識・理解・対話)
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- SP2000-16 楽曲の高速検索手法の検討
- 時系列の歪み一定区分化法とセグメント探索における評価(一般, 一般, チュートリアルレクチャー)
- 字幕表示のための音声とテキストの自動対応付け手法とその評価
- Cepstrum Fluxを用いた音声区間の検出
- 話者認識を用いたコンピュータセキュリティシステムの評価
- 音響シーンセグメンテーション法の検討
- 音声/非音声判別法を用いた時間圧縮音声再生法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声/非音声判別法を用いた時間圧縮音声再生法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声/非音声判別法を用いた時間圧縮音声再生法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- セグメント高速探索法とその評価(Session-2 情報検索, 第7回音声言語シンポジウム)
- セグメント高速探索法とその評価(Session-2 情報検索, 第7回音声言語シンポジウム)
- セグメント高速探索法とその評価(Session-2 情報検索, 第7回音声言語シンポジウム)
- Video Caption Player 2.4 : 複数字幕同時表示機能の追加(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 書き起しテキストのある音声ドキュメントの検索
- 音声とテキストの自動対応付けによる音声インデキシング手法とその評価(要約, 検索, 認識・理解・対話・一般)
- テキスト情報を利用した音声インデキシング
- 長時間音声字幕化のための朗読単位への区分化
- 字幕表示用言語VCMLの設計とその表示システムの開発
- 字幕自動生成における字幕と音声の時間軸整合の検討
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 音声区間検出のためのVQ符号帳の自動学習
- 出現確率の幾何学的性質を用いたセグメント高速探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 出現確率の幾何学的性質を用いたセグメント高速探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- Active探索におけるノルムと類似度との関係(聴覚・音声・言語とその障害, 一般)
- 音響情報の検索
- 複数時系列中の類似セグメント高速探索法(情報検索)
- 類似セグメント高速探索法における球被覆の検討(認識,理解,対話,一般)
- 距離に基づくActive探索法の計算量について(認識・理解・対話・一般)
- 複数時系列中の類似セグメント探索法の提案と評価(聴覚・音声・言語とその障害,一般)
- Active探索法による出現確率時系列の区分化とクラスタリング(一般, STRAIGHTスペシャルセッション(SS))
- 5N-9 手話パターン間距離の導出
- 2T-2 インターネット対応音響効果支援ツールキットの開発
- セグメントの高速探索法
- セグメントの高速探索法
- Java言語を用いたInternet対応しりとりゲーム
- ビデオデータにおける指定人物の検出と追跡 : 音声部分を用いた処理
- 音響シーンセグメントの接続の検討