複数人物の対面会話を対象としたマルコフ切替えモデルに基づく会話構造の確率的推論(ヒューマンインタフェース基礎)
スポンサーリンク
概要
- 論文の詳細を見る
複数人物による対面会話を対象とし,会話参加者の視線パターン,頭部方向,および,発話の有無に基づき会話の構造の推論を行うための確率的枠組みを提案する.本研究では,まず,会話の構造として,話し手,受け手,傍参与者と呼ばれる参与役割と会話参加者との組合せに着目する.次に,会話中の各人物の行動は,会話の構造によって規定されるという仮説を立て,マルコフ切替えモデルと呼ばれる一種の動的ペイジアンネットを用いた会話モデルを提案する.このモデルは,会話レジームと呼ばれる会話の構造に対応した上位プロセスの状態が,マルコフ過程に従い時間変化しつつ,その会話レジームの状態に依存して,視線パターン,および,発話が確率的に生成され,さらに,各人の視線方向に依存して頭部方向が観測されるという階層的な構造を持つ.このモデルにおいて,会話レジームは,会話中に頻出する視線パターンの特徴的な構造に基づいて仮説的に設定される.また,ギプスサンプリングと呼ばれる一種のマルコフ連鎖モンテカルロ法を用いて,観測された頭部方向と発話の有無の時系列データより,会話レジーム,視線パターン,および,モデルパラメータのベイズ推定を行う方法を提案する.最後に,4人会話を対象とした実験により,視線方向と会話レジームの推定精度を評価し,提案した枠組みの有効性を確認する.
- 一般社団法人情報処理学会の論文
- 2006-07-15
著者
-
大塚 和弘
日本電信電話株式会社コミュニケーション科学基礎研究所
-
大和 淳司
日本電信電話株式会社コミュニケーション科学基礎研究所
-
村瀬 洋
名古屋大学大学院情報科学研究科
-
大和 淳司
Nttコミュニケーション科学基礎研究所
-
大塚 和弘
NTTコミュニケーション科学基礎研究所
-
大塚 和弘
NTTサイバーソリューション研究所
-
大塚 和弘
NTTヒューマンインタフェース研究所
-
大和 淳司
日本電信電話(株)第三部門
-
竹前 嘉修
NTTサイバーソリューション研究所
-
Yamato Junji
Ntt Communication Science Laboratories Ntt Corp.
-
大塚 和弘
横浜国立大学工学部電子情報工学科
-
村瀬 洋
名古屋大学
-
大和 淳司
日本電信電話(株)NTTコミュニケーション科学基礎研究所
関連論文
- Twitterにおける実況書き込み検出手法の検討(映像コンテンツ,人工現実感)
- 調理動作に注目したマルチメディア料理レシピの提案(萌芽(生活メディア)セッション,生活メディア)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(テーマセッション,映像ハンドリング技術とその応用)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- メモリベースパーティクルフィルタ : 状態履歴に基づく事前分布予測を用いた頑健な対象追跡(画像映像解析,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 色変動を考慮した生成型学習法による道路標識検出器の構築(パターン認識応用,画像の認識・理解論文)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- MCMC-based particle filterを用いた人間の映像注視行動の実時間推定(テーマセッション,映像ハンドリング技術とその応用)
- 画像認識とGPU (特集 ロボットを進化させる最先端IT技術)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- パラメトリック表現に基づく医用画像の高速位置あわせ
- 多様な属性に柔軟に対応できる人物属性認識の準教師付き学習フレームワーク(一般セッション,光と色の解析・表現とその応用)
- 画像認識とGPU
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 空撮画像と時系列車載カメラ画像との照合による自車位置推定(テーマセッション関連,一般物体認識・画像特徴量)
- 一般物体認識のためのマルチモーダル星座モデル(パターン認識と学習,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 運転者支援のための交通信号機視認性数値化手法
- 街並み画像系列と2台の車載カメラの画像系列との照合による自車の走行位置推定(テーマセッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
- 複数映像統合による車載カメラ映像からの移動物体除去(一般セッション,一般物体認識・画像特徴量)
- 色を忠実に再現する高精細分光画像撮影技術 (特集 「見る・見せる」技術の最先端)
- 車載カメラ映像からの学習サンプルの自動収集による標識検出器の高精度化に関する検討 (パターン認識・メディア理解)
- 放送映像における準同一映像区間の出現パターンによる分類(一般セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 放送映像における準同一映像区間の出現パターンによる分類(一般セッション4)
- 注視対象の位置関係を利用した車載視線計測システム自動較正の高度化 (ヒューマン情報処理)
- 注視対象の位置関係を利用した車載視線計測システム自動較正の高度化 (パターン認識・メディア理解)
- 木構造解析による胸部X線CT像からの肺動脈・肺静脈の自動分類(ポスター2, 医用画像一般)
- 血管と気管支の空間的配置特徴に基づく胸部X線CT像からの肺動脈・肺静脈自動分類(画像処理・解析, 画像の認識・理解論文)
- 胸部X線CT像からの解剖学的分布特徴を利用した肺動脈・肺静脈の分類(領域抽出及び関連技術)(関連学会との共催によるバイオメディカルイメージング連合フォーラム)
- 車載レーザスキャナによる距離データマップの構築と高精度自車位置推定(パターン認識)
- 胸部X線CT像における小結節像からの炎症性小結節の自動認識の一手法
- 頭部姿勢の変動に頑健な表情認識技術--表情から人の気持ちを読み取ることを目指して
- パーティクルフィルタとこう配法の組合せによる頭部姿勢と表情の同時推定(メディア処理,画像の認識・理解論文)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 複数人会話における非言語インタラクション構造の推定--誰が誰にどのように反応しているか?
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 高速メディア探索 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 動作認識のための状態遷移モデル : HMMの高度化と非HMM手法の成長(「時系列データの認識 : HMMを越えて」)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- CVPR2009報告 (パターン認識・メディア理解)
- 適応的領域分割と閾値推定を用いた高速テンプレートマッチング(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 適応的領域分割と闘値推定を用いた高速テンプレートマッチング(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 複数人物の対面会話を対象としたマルコフ切替えモデルに基づく会話構造の確率的推論(ヒューマンインタフェース基礎)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- CVPR2009報告
- 人と機械のインタラクションにおける画像技術 (メディア工学)
- パーティクルフィルタとMCMC : そのコミュニケーション科学への応用(若手研究者のための講演会)
- ペット型ロボットのための全身触覚インタフェースによる人の触行動識別
- ペット型ロボットのための全身触覚インタフェースによる人の触行動識別
- 圧力分布センサによる人の触行動の実時間識別とその個人適応手法
- 会話シーン分析のための音声映像技術 (特集 コミュニケーション科学の融合研究における新潮流)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 変動輝度テンプレートによる頭部姿勢と表情の同時推定
- ICMI 2007参加報告
- コミュニケーションを理解する音声・映像技術 (特集 我が国基礎・基盤研究の現状--NTTコミュニケーション科学基礎研究所)
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- Robust Character Recognition Using Adaptive Feature Extraction Method
- Basic Design of Video Communication System Enabling Users to Move Around in Shared Space
- H-036 Subtle Facial Expression Recognition Based on Expression Category-dependent Motion Magnification
- LH-003 変動輝度テンプレートを用いた頭部姿勢変動に頑健な確率的表情認識手法(画像認識・メディア理解)
- 非言語行動の観測に基づく複数人物の会話シーン分析 招待講演
- 姿勢とアピアランスの変化に頑健な対象追跡を実現するアピアランス統合メモリベースパーティクルフィルタ (画像の認識・理解論文特集)
- 対面の複数人対話を撮影対象とした対話参加者の視線に基づく映像切替え方法とその効果(グループウェア)
- 複数人対話シーンの映像編集のための対話参加者の視線に基づく映像切り替え方法とその効果(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- A-14-6 対話参加者の視線に基づく映像切り替え方法とその効果(A-14. ヒューマンコミュニケーション基礎)
- 視線の機能に着目した映像切り替え規則とその効果 : 人に分かりやすい映像生成を目指して(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- A-15-9 視線情報に基づく映像切り替え規則とその評価
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- 姿勢とアピアランスの変化に頑健な対象追跡を実現するアピアランス統合メモリベースパーティクルフィルタ(画像・映像解析,第13回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 身体尺から見直すタッチパネル・インタフェース--ハードウェアの模倣からソフトウェアの柔軟さ (マルチメディア情報ハイディング・エンリッチメント)
- 身体尺から見直すタッチパネル・インタフェース--ハードウェアの模倣からソフトウェアの柔軟さ (画像工学)
- 身体尺から見直すタッチパネル・インタフェース--ハードウェアの模倣からソフトウェアの柔軟さ (ライフインテリジェンスとオフィス情報システム)
- 手話会話における修復組織の分析(一般,『コミュニケーションの身体を捉える』及び一般)
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- 複数人対話を対象とした表情と視線に基づく共感/反感の推定モデルとその評価--対話者間に生まれる感情をいかに理解するか? (ヒューマンコミュニケーション基礎)
- The Subjective Evaluation Experiments on an Automatic Video Editing System Using Vision-based Head Tracking for Multiparty Conversations (特集:日常活動を変革する情報システム技術)
- 多視点観測に基づく複数物体の相互オクルージョン解析と逐次状態推定
- 多視点観測に基づく複数物体の相互オクルージョン解析と逐次状態推定
- 複数人対話を対象とした表情と視線に基づく共感/反感の推定モデルとその評価 : 対話者間に生まれる感情をいかに理解するか?(顔とコミュニケーション)
- 身体尺から見直すタッチパネル・インタフェース : ハードウェアの模倣からソフトウェアの柔軟さ (メディア工学)
- 招待講演 複数人会話シーン分析の研究と今後の展望 (音声)
- 動くディスプレイで会話が伝わる (特集 情報と人間を結ぶコミュニケーション科学)
- ビデオ通信環境における対人印象に関する探索的研究 : 当事者評価と傍観者評価の比較(コミュニケーションの心理及び一般)
- 手話会話における表現モダリティの継続性(相互作用のマルチモーダル分析)
- ビデオ通信環境における対人印象の規定因に関する探索的実験研究 : 第三者に対する映像呈示と音声呈示の比較(コミュニケーション(技術),「身体,あそび,コミュニケーション」及びコミュニケーション一般)
- MM-Space:頭部運動の物理的補強表現に基づく会話場再構成
- 複数人会話シーン分析の研究と今後の展望(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)
- 正確な色再現を目的とした2眼ステレオ式6バンドビデオシステム(テーマセッション,実時間処理実空間センシングと環境理解)
- 視線一致範囲測定に関する探索的検討 : 疎らな実験データの解析(『場のデザイン』及びコミュニケーション一般)
- アイコンタクト知覚範囲の性差に関する探索的検討 : 社交性不安およびアイコンタクト相手の性別の影響(顔、表情の認知・理解,コミュニケーションの心理及び一般)