映像中の人物行動の認識とその自然言語記述に関する研究(自然言語)(<特集>人工知能分野における博士論文)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,映像中の人物行動を認識するとともに,その動作を逐次自然言語で表現する方法を提案する.従来のコンピュータビジョンは,画像から物体の形状や位置・姿勢を回復するという問題に集中してきた.しかしながら,現実の世界においては必ずしも物体の識別が最終的な目的とは限らない.情報の最終的な受容者である人間にとって,知的活動の基本となる種々の概念を扱う最良のメディアは自然言語であり,映像を自然言語の意味論に基づいて解釈し,伝達・提示することが,コンピュータビジョンの究極の目標であるといえる.第1章の序論に続き,第2章では,映像から自然言語ヘメディア変換するための基本的な考え方として,映像から種々の特徴量すなわち意味素性を抽出し,それを組み合わせることで事象概念を形成する方法について述べている.第3章では,映像中の人物の顔および手領域をロバストに追跡する手法を提案し,第4章では,人物の位置・姿勢の時系列変化と,シーン中の物体との相対的な位置関係をもとに,人物の動作を格文法に基づく格フレームで表現する方法を提案している.第5章では,自然言語の動作表現に関する概念階層を導入するとともに,これを身体部位ごとに適用することで動作表現を生成し,これらを統合して最終的に自然言語のテキストを生成する手法を提案している.第6章では,本論文の成果について総括している.
- 2004-01-01
著者
関連論文
- 貴重文化資料デジタルアーカイブのWebによる検索・共有システムの構築
- 人物動作のn-gram表現に基づく物体認識(テーマセッション関連,一般物体認識・画像特徴量)
- 人物動作の n-gram 表現に基づく物体認識
- 全身の押し付け力を検出できるロボット競技評価用の小型レスキューダミーの開発
- レスキューロボットコンテストのための競技運営支援システムの開発と評価(支援・管理システム,システム開発論文)
- レスキューロボットコンテストのための競技運営システムの構築と評価(情報システムとモデリングおよび一般課題)
- O-001 レスキューロボットコンテストのための競技運営システムの開発(情報システム,一般論文)
- 連続フレームからの抽出画像の重ね合わせによるロバストな道路標識認識手法(画像認識,コンピュータビジョン)
- レスコンの得点計算システム(「レスキューロボットコンテスト」)
- 連続フレームからの抽出画像の重ね合わせによる障害物遮蔽を考慮した道路標識認識(ITS画像処理, データベース, 一般)
- 文化資料保存・公開のための画像データベースの開発
- 大阪府立大学における認証基盤の構築
- 独居高齢者の行動パターンに注目した非日常状態の検出
- I-057 ウェアラブルカメラによる人物行動の認識と複数メディアを用いた要約表現(I.画像認識・メディア理解)
- 人物の位置・姿勢に注目した行動パターンの学習・認識と非日常状態検出への応用(画像認識,コンピュータビジョン)
- ウェアラブルカメラを用いた人物行動のマルチモーダル表現(複合現実感とインタラクション)
- 大阪府立大学における情報リテラシー教育の評価
- 姿勢特徴のn-gram表現を用いた人物行動による物体認識 (パターン認識・メディア理解)
- 研究者支援機能を備えた写真画像データベースの開発
- SVMを用いたネットワークトラヒックからの異常検出
- 運転者の目領域抽出による視線推定
- 教育研究用情報処理システムの更新
- 姿勢特徴のn-gram表現を用いた人物行動による物体認識(一般セッション,Computational Photography)
- D-12-39 移動ロボットによる人物の動作認識と自然言語表現(D-12. パターン認識・メディア理解,一般セッション)
- LI-007 身体の軌跡情報の解析に基づいた動作と動作対象の統合的認(I分野:画像認識・メディア理解)
- 協調型ベイジアンネットワークを用いた動作と動作対象の統合的認識(テーマ関連セッション(2))
- 動作と物体の統合的認識とそのモデル化(テーマ関連セッション(2))
- 画像・図と言語の統合
- 一階論理の形式化によるオブジェクト指向モデルの記述言語と推論系
- プロパティ理論と情報の論理に基づくエージェント・モデルの一階論理による形式化
- 人感センサによる独居高齢者の行動パターンの認識(福祉情報工学と画像処理、一般)
- ウェアラブルカメラによる動作の認識とテキスト表現(映像・マルチメディアとパターン認識・理解)
- ウェアラブルカメラによる動作の認識とテキスト表現(映像・マルチメディアとパターン認識・理解)
- ウェアラブルカメラによる動作の認識とテキスト表現(映像・マルチメディアとパターン認識・理解)
- 情報教育WSシステムの概要
- 中尾佐助資料スライドデータベースの構築と利用者間情報共有への展望(ナレッジ・マネジメントとレコード・マネジメントII : 学問と知識)
- 教育コンテンツの創生, 蓄積, 編集, 配信および共有を一元化する統合システムの検討
- 動作と物体の統合的認識とそのモデル化
- D-12-160 ウェアラブルカメラによる人物行動の認識
- D-12-87 手の動きを考慮した人物動作のテキスト表現
- 人物の位置・姿勢に注目した行動パターンの認識
- 人物の位置・姿勢に注目した行動パターンの認識
- 映像中の人物行動の認識とその自然言語記述に関する研究(自然言語)(人工知能分野における博士論文)
- コミュニケーションを重視した遠隔教育システムの構築
- 動作表現グラフによる人物行動のテキスト表現
- レスキューロボットコンテスト競技運営支援システムのデータベース設計と実装
- ギガビットスイッチによる高速キャンパスネットワークの構築とその運用
- ギガビットイーサネットによるキャンパスネットワーク
- HMMによる行動パターンの認識
- 物体の機能と人物の動作解析によるシーン認識(映像・マルチメディアとパターン認識・理解)
- 物体の機能と人物の動作解析によるシーン認識(映像・マルチメディアとパターン認識・理解)
- 物体の機能と人物の動作解析によるシーン認識(映像・マルチメディアとパターン認識・理解)
- D-12-155 人物行動の解析に基づくシーン認識
- ホスト情報管理システムUCANN
- マルチメディア遠隔講義システムの構築と操作環境の開発
- 動画像における人物行動の自然言語による説明の生成(動画像処理論文特集)
- 人物行動の説明テキスト生成のための位置・姿勢推定
- 動画像における人物行動のテキスト表現
- 動画像に基づくテキスト生成とその報知システムへの応用
- 身体各部の動作概念の階層性の基づく動画像中の人物行動のテキスト表現
- 身体各部の状態遷移に基づく人物行動のテキスト表現
- 色情報と領域追跡情報を用いた人物の顔と手の領域の抽出
- 人物の行動パターンに注目した異常通知システム
- Gsharpによるデータの可視化
- ユーザー事例 100台のレイヤ3ギガビットEthernetスイッチでマルチメディア化をめざす大阪府立大学
- 社会福祉学部における情報基礎科目の実施
- コミュニケーションエージェントに支援された遠隔講義環境の構築に関する検討
- Javaへの招待
- 電子テキストの開発
- 大阪府立大学におけるWWWの紹介
- LMSを利用した学習者コーパス構築のための教室外英作文活動