Kinectとパーティクルフィルタを用いたHMM手話認識手法の検討(テーマセッション,時系列パターン認識)
スポンサーリンク
概要
- 論文の詳細を見る
本論文ではKinectによる手話認識手法を提案する.Kinectにより得られたRGB画像と距離情報を統合し,パーティクルフィルタにより,3次元空間上での手の位置座標を推定して,HMMにより連続手話認識を行った.その結果,従来手法であるRGB画像のみを用いたものと比較して認識精度を76.2%から86.0%に向上させることができた.また,磁気センサを用いた場合に比べ,認識精度の低下を1%以下に抑えることができた.実用的な応用を考慮した場合,磁気センサは高価で,装着するのも面倒であるが,提案手法は一般のユーザでも容易に入手可能なKinectのみを使用するため,実用的であるということが言える.
- 2012-02-02
著者
-
川本 一彦
千葉大学総合メディア基盤センター
-
篠崎 隆宏
東京工業大学大学院情報理工学研究科計算工学専攻
-
堀内 靖雄
千葉大学
-
黒岩 眞吾
千葉大学
-
堀内 靖雄
東京工業大学工学部情報工学科
-
堀内 靖雄
千葉大学工学部
-
篠崎 隆宏
ワシントン州立ワシントン大学
-
川本 一彦
千葉大学
-
堀内 靖雄
千葉大 大学院融合科学研究科
-
堀内 靖雄
千葉大学 大学院自然科学研究科
-
堀内 靖雄
東京工業大学工学部
-
西村 洋介
千葉大学
-
黒岩 眞吾
千葉大学大学院融合科学研究科
-
篠崎 隆宏
千葉大学
-
今村 大輔
千葉大学
-
堀内 靖雄
千葉大学大学院 融合科学研究科 情報科学専攻
関連論文
- 年齢推定のための音声特徴量および推定器の検討 (音声)
- 運動パラメータの直接サンプリングによる逐次カメラ運動推定(幾何学的解析・最適化,画像の認識・理解論文)
- F_0パターン生成モデルのための数量化I類の平均値置換による話者適応法の検討(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 高精度音声認識のための教師なしクロスバリデーションおよび集合適応法の提案(認識)
- 話者交替規則に基づいた日本手話対話の話者交替の分析
- ヒューマンインタフェースシンポジウム2009報告
- ヒューマンインタフェースシンポジウム2007報告
- 日本手話の表現速度の違いによる手動作変化の分析(福祉と音声処理,一般)
- Webページ間の関係に着目した大規模サイトの構造化の調査 : 音声ブラウザ利用におけるアクセシビリティの検討
- パネル討論会「コンピュータサイエンスとしての音楽情報処理」の報告 : 第52回全国大会シンポジウム
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- (1)姿勢とチェロ演奏(SIGMUS第27回研究発表会報告・質疑記録)
- 日本語地図課題対話コーパスの設計と特徴
- 5.音声の知見の情報福祉への応用(バリアフリー社会に向けた音声情報処理)
- 年齢推定のための音声特徴量および推定器の検討(音声・言語・音響教育,一般)
- 音声の有無による違いを考慮した Home video 簡易編集
- 日本手話の後続うなずきの機能に関する検討(福祉情報工学一般)
- 見えの生成モデルに基づく物体追跡
- ブレスの合図を認識する伴奏システムの実装と評価(システム)
- 最適な最小値独立置換族の構成
- 位置と動きに基づくマルチストリームHMMを用いた手話認識
- 手の位置と動きに着目したHMMによる手話単語の認識(一般,膨大なデータから学ぶもの)
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- 音声対話システムにおける発話予測を利用した音声認識
- 幾何学的拘束条件を必要としない動画像の領域分割
- 零空間探索による形状復元
- ランダム標本化と投票による3次元復元
- 空間直線決定のためのハフ変換
- ハフ変換を応用した3次元物体の復元
- ランダム標本化と投票による図形の対称性の認識
- ランダム標本化と投票による物体復元
- 投票による物体復元
- A Polynomial Time Sampling Algorithm for an Optimal Family of Min-Wise Independent Permutations (Models of Computation and Algorithms)
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 3DCGによる手話文アニメーション合成システムの構築と評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 書き起こしへの付与を目指した音声とテキストを対象とした発話印象の分析
- 音声認識の信頼度に着目した文境界検出に関する検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 音声認識の信頼度に着目した文境界検出に関する検討
- 視覚障害者のための意味情報を用いた仮名漢字変換における説明語選択手法の検討(福祉と音声処理,一般)
- 曲中のブレスによる合図を利用した伴奏システム
- 日本手話対話の話者交替時の重複現象の分析
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- 日本手話対話の話者交替時の重複現象の分析(一般セッション,コミュニケーション支援,共生コミュニケーション及び一般)
- ブレスによる合図を検出する伴奏システム
- 特集「音楽情報処理」の編集にあたって
- 音声の有無による違いを考慮したHome video簡易編集
- 蓮根:演奏生成システムによるピアノコンクール実施推進のためのワークショップ : 報告とパネルディスカッション
- (3)くし形フィルタによる異楽器音のピッチ推定と演奏楽器推定(SIGMUS第27回研究発表会報告・質疑記録)
- 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識(耐雑音)(第5回音声言語シンポジウム)
- 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識(第5回音声言語シンポジウム : 耐雑音)
- 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識(第5回音声言語シンポジウム : 耐雑音)
- 話し言葉音声の認識を目指して
- 話し言葉音声の認識を目指して
- 話し言葉音声の認識を目指して
- HMM音声合成における自然性と個人性に優れた韻律モデル適応法の検討
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- 話し言葉コーパスを用いた音声認識の検討
- 教師なしクロスバリデーション適応法の諸条件における評価
- 教師なしクロスバリデーション適応法の諸条件における評価
- 効率的なクロスバリデーションに基づく混合ガウス分布の最適化法とその拡張(音響モデル)
- 音響モデルのアンサンブル学習
- 5X-8 User identification using Time-of-Flight camera image streams
- 発話速度変動を考慮した隠れモードHMMによる音声のモデル化 : 音声認識におけるベイジアンネットの応用(聴覚・音声/一般)
- 大語彙連続音声認識のための言語的音響的属性に基づく単語単位の最適化
- 言語モデルの教師なしバッチ型話題適応
- 言語モデルのバッチ型教師なし適応化法
- 言語モデルのバッチ型教師なし適応化法
- 複数人物追跡のためのセルオートマトン型歩行者行動モデルのパラメータ推定に関する基礎検討
- 注視誘導のための視覚的顕著性に基づく画像加工
- 純粋関数型言語を用いた超コンパクト音声認識デコーダの開発
- 話し言葉音声認識における話者間の認識率変動要因の解析
- 言語モデルのバッチ型教師なし適応化法
- 日本語話し言葉コーパスを用いた講演音声認識(音声言語情報処理とその応用)
- 話し言葉音声認識における認識性能の個人差の解析
- 話し言葉音声認識における話者間の認識率変動要因の解析
- 話し言葉音声認識における話者間の認識率変動要因の解析
- 話し言葉認識における決定木を用いた誤り要因の分析
- 適応的な視覚追跡のための統計的運動モデル
- 線形代数で語る画像圧縮入門
- Slice Chain Max-Sumアルゴリズムによるタンパク質のポテンシャルエネルギー最小化に関する研究
- 図書館内での自己位置推定のためのファジィコードブック型画像探索法
- Kinectとパーティクルフィルタを用いたHMM手話認識手法の検討(テーマセッション,時系列パターン認識)
- Kinectとパーティクルフィルタを用いたHMM手話認識手法の検討(テーマセッション,時系列パターン認識)
- 日本手話対話と日本語音声対話における話者交替現象の比較分析(福祉情報工学一般,ライフイノベーションのための介護・リハビリ・生活支援技術)
- 複数人物の移動軌跡データからの環境モデルパラメータの逐次ベイズ推定
- 複数人物の移動軌跡データからの環境モデルパラメータの逐次ベイズ推定
- 隠れマルコフモデルを用いた眼電位認識の研究(一般セッション,時系列パターン認識)
- 隠れマルコフモデルを用いた眼電位認識の研究(一般セッション,時系列パターン認識)
- 背景から推定した地理情報を用いたフレームアウトを生じるターゲットの追跡
- Kinect とパーティクルフィルタを用いたHMM手話認識手法の検討
- 非同期な複数距離カメラを用いた移動物体の3次元位置合わせ(エンタテインメントのためのメディアとリアリティー)
- 動画像において隠れやフレームアウトを伴うターゲットの予測追跡
- 人流シミュレーションモデルと画像計測の融合
- 超解像処理のためのベイズ型情報量基準に基づく正則化パラメータの自動決定
- ICPR 2012レポート
- チュートリアル講演 粒子フィルタによる対象追跡の動向 (スマートインフォメディアシステム)
- 誘目性を活用した画像加工による注視誘導 (パターン認識・メディア理解)
- グリッド法を用いた粒子フィルタのラオ・ブラックウェル化(コメント制度セッション,実時間処理実空間センシングと環境理解)