マルチモーダル情報処理の研究動向(マルチモーダル)

概要

論文の詳細を見る
本論文では,2008年9月22日から26日までオーストラリアのブリスベンで開催された国際会議INTERSPEECH2008,そのサテライトワークショップとして開催されたAVSP2008(Auditory-Visual Speech Processing)およびMMSP2008(MultiMedia Signal Processing),そして10月20日から22日にかけてギリシアで開催された国際会議ICMI2008(International Conference on Multimodal Interface)について,音声関連のマルチモーダル情報処理に関する研究紹介を行う.これらを通じて,近年のマルチモーダル情報処理の研究動向について報告する.
2008-11-13

著者

田村哲嗣
岐阜大学工学部
桂田浩一
豊橋技術科学大学大学院工学研究科
伊藤慶明
岩手県立大学ソフトウェア情報学部
桂田浩一
豊橋技術科学大学:(現)株式会社東芝
桂田浩一
豊橋技科大
桂田浩一
豊橋技術科学大学大学院工学研究科知識情報工学専攻
伊藤慶明
岩手県立大
桂田浩一
豊橋技術科学大学
田村哲嗣
岐阜大学大学院工学研究科応用情報学専攻
田村哲嗣
岐阜大

関連論文

マルチモーダル情報処理の研究動向(マルチモーダル)
加速度情報を用いた日常行動認識について(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
幼児エージェントにおけるバイアスの形成と言語の構造化
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
Suffix Arrayを用いた音声文書の高速検索
ウェブブラウザ上で動作可能なマルチモーダル対話システム(プラットフォーム)
音声対話技術コンソーシアム(ISTC)の活動成果報告(SIG-SLP内組織の活動報告)
2ZJ-6 動画視聴時の注目点を考慮した動画推薦方法の提案(人間行動,障害等支援,学生セッション,コンピュータと人間社会)
3ZA-7 デフォルメ地図の地上座標系へのマッピングを利用した現地情報提供システム(ITSネットワーク・地図情報,学生セッション,ネットワーク)
DS-2-5 共有信念に基づく発話場面の推定(DS-2. 共生コンピューティング,シンポジウムセッション)
DS-1-11 Cellプロセッサを用いた音声検索エンジンの高速化(DS-1. COMP-NHC学生シンポジウム,シンポジウムセッション)
音声対話システムと質問応答システムの連携による質問応答対話の実現と対話シナリオの検討
生徒の検索情報を利用した講義の重要語抽出
幼児の学習バイアスを利用したエージェントによる語意学習の効率化
語彙学習エージェントにおけるバイアスの自律調整について
因果性に基づく信念形成モデルとN本腕バンディット問題への適用
マルチモーダル対話システムのための階層的アーキテクチャの提案
重要語句に対する関連スライド群抽出法の検討(オープンソースソフトウェアの教育利用/一般)
講義情報を用いた自主学習支援システムの構築
エージェントによる語意学習効率化のための対話戦略獲得
Agent-Agent 対話により獲得した戦略に対する人間-Agent 対話からの実験評価
語意自動獲得における学習バイアスの効果
救急災害領域における情報支援システム(わが国における救急・災害医療の将来)
ブースティングによるマルチモーダル音声区間検出の結果統合 (音声)
M-013 3軸加速度センサを用いた隠れマルコフモデルによる人間の行動識別(ユビキタス・モバイルコンピューティング,一般論文)
加速度情報を用いた日常行動認識について(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
加速度情報を用いた日常行動認識について(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
画像特徴量の正規化によるマルチモーダル音声認識の改善(マルチモーダル)
マルチモーダル音声認識における音声と画像の同期に関する調査(マルチモーダル)
E-007 Wikipediaのカテゴリを利用したWeb検索結果のフィルタリングの検討(自然言語・音声・音楽,一般論文)
2ZD-5 統計的音声区間検出法を用いた加速度センサによる人間の動作検出(動作認識・大画面,学生セッション,インターフェース)
音声と画像のconfusion networkを用いたマルチモーダル音声認識
SOSとマイクロフォンアレイの統合による会議記録システムの開発
デジタルペン文字認識システムを用いた在宅看護支援における誤認識自動訂正機能(一般,テキスト情報の要約と掲示に関わる自然言語処理シンポジウム及び一般)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
調音運動HMM音声合成における調音特徴--声道パラメータ変換と音源の改良 (音声)
調音運動HMM音声合成における調音特徴--声道パラメータ変換と音源の改良 (言語理解とコミュニケーション)
ブースティングによるマルチモーダル音声区間検出の結果統合(音声・言語・音響教育,一般)
雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
調音運動HMM音声合成における調音特徴-声道パラメータ変換と音源の改良
階層型アーキテクチャに基づいたWebベースMMIシステムの開発 (音声)
静的・動的情報を利用したMMIシステムの設計と実装(検索・対話)
受講情報を利用した学習支援機能付き講義再現システムの開発(遠隔教育/一般)
雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(ポスターセッション)(第5回音声言語シンポジウム)
音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(第5回音声言語シンポジウム : ポスターセッション)
音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討(第5回音声言語シンポジウム : ポスターセッション)
階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
階層型アーキテクチャに基づいたWebベースMMIシステムの開発(一般セッション,クロスモーダル)
マルチモーダル対話作成支援ツールGalatea-IBの機能強化
例外に着目した知識ベースの変換メカニズムの形式化
マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
マルチモーダル音声区間検出を用いたマルチモーダル音声認識の検討(一般セッション,クロスモーダル)
大規模音声ドキュメントを対象とした高速キーワード検索システムとその評価
1U-10 調音特徴に基づく音素単位での英語発音誤り検出と発音評価(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
E-021 映像コンテンツ理解支援のためのキーワード表示方式の検討(自然言語・音声・音楽,一般論文)
文書分類システムの分類誤りに着目した分類ルール修正法
AAMを利用した表情成分抽出に基づく表情模倣システム(テーマ関連,顔・人物・ジェスチャ・行動)
AAMを利用した表情成分抽出に基づく表情模倣システム(テーマ関連,顔・人物・ジェスチャ・行動)
英語発音学習のための調音特徴抽出と発音評価
階層的MMIアーキテクチャに基づくプラットフォーム実装方法の検討
調音運動HMMに基づくワンモデル音声認識合成
Suffix Arrayを用いた高速なキーワード検索
5U-2 柔軟なモジュール切替が可能なWebベースMMIシステムの開発(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
4Y-5 AAMを利用した表情の模倣(顔・人物画像処理(2),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
形容詞/名詞の分化と典型的事例の自己組織化に関する構成論的モデル
幼児エージェントにおけるバイアスの形成と言語の構造化(セッション4)
講義再現システムにおけるスライド重要度抽出
SD-2-3 非言語情報を用いた講義スライド重要度抽出
講義再現システムにおけるスライドへの重要度自動付与法とその評価 (先端メディアの教育利用と教材データの格納・再利用/一般
E-039 MMI6階層モデルに準拠したWebベースMMIシステムの開発(自然言語・音声・音楽,一般論文)
Online-EMによる語意学習機構と学習バイアスの適用(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
Online-EMによる語意学習機構と学習バイアスの適用(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
Online-EMによる語意学習機構と学習バイアスの適用(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
D-024 レシピの自動生成に向けた調味料推定の評価(データベース,一般論文)
E-047 会議録自動作成システムに向けた話者識別技術の検討(自然言語・音声・音楽,一般論文)
音声・画像のモダリティ間の相互作用に着目した音声認識のモデル適応 (音声)
キーワード抽出による映像コンテンツの理解支援の検討
音声・画像のモダリティ間の相互作用に着目した音声認識のモデル適応(音声・言語・音響教育,一般)
肺音の情報処理と応用 (特集生体・医用における先端画像処理技術)
雑音環境下にける静的・動的情報を用いた音響モデル適応 (音声)
GIF-SP : 汎用・識別的な特徴量を用いた音声認識性能の改善(耐雑音処理,第13回音声言語シンポジウム)
GIF-SP : 汎用・識別的な特徴量を用いた音声認識性能の改善(耐雑音処理,第13回音声言語シンポジウム)
スパース表現を用いた実環境における喀痰検出(ポスター講演,ポスターショートオーラル,時系列パターン認識)
スパース表現を用いた実環境における喀痰検出(ポスター講演,ポスターショートオーラル,時系列パターン認識)
肺音の情報処理と応用
スパース表現を用いた実環境における喀痰検出
E-027 汎用・識別的特徴量を用いた音声区間検出(音声情報処理,E分野:自然言語・音声・音楽)
スパース表現を用いた実環境における喀痰検出
雑音環境下における静的・動的情報を用いた音響モデル適応(雑音下音声認識,認識,理解,対話,一般)
RO-008 検索新聞 : 新聞形式型検索情報提示システムにおけるマイクロブログを用いたユーザ適応(情報検索,O分野:情報システム)
高精度なマルチモーダル音声認識の実現に向けた取り組み(オーガナイズドセッション)

マルチモーダル情報処理の研究動向(マルチモーダル)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク