口唇の色彩情報および形状情報に着目した発話フレーム検出法
スポンサーリンク
概要
- 論文の詳細を見る
論文概要:L*a*b*表色系を用いて得られた口唇の形状および発話に伴う動き特徴は,個人識別や非接触インタフェースの有用な入力情報となること,口唇の動きは発話されたコマンドを識別する特徴量として有効であることが明らかとなっている.しかしながら,L*a*b*表色系に着目した従来技術は,発話動画像における発話区間の検出をオペレータの目視で行っており,自動推定を行うまでには至っていない.そこで本論文は,個人識別ならびに発話認識などのインタフェースにおける発話区間の自動推定を目的とし,発話動画像の連続したフレームから発話フレームを自動検出する手法を提案する.提案手法は,発話時の口唇画像における L*a*b*表色系の色彩情報および口唇形状の時系列変化を特徴量として用いる手法であり,次の3つのステップから構成される.はじめに,発話時の時系列顔画像から口唇を抽出する.次に,口唇の垂線上におけるL*およびa*の推移に着目して口裂(口を閉じたときの上唇と下唇の境界)の有無を調べ,各フレームにおける口の開閉状態を判定する.最後に,3フレーム間における口唇形状の時系列変化から発音の過程で閉口状態となった発話フレームを判定する.5つの母音全てを含む人名を発話内容として,被験者5名による実験を行った結果,約99.2%の精度で発話フレーム検出が可能であることが明らかとなった.
著者
関連論文
- NOAA-AVHRRデータにおける地上基準点自動抽出アルゴリズム
- 口唇の動き特徴を用いた非接触コマンド入力インタフェースの提案
- 雑音を含む音声信号と発話に伴う口唇の動き特徴を用いた個人識別(文書・文字メディアの認識・理解, 一般)
- 雑音を含む音声信号と発話に伴う口唇の動き特徴を用いた個人識別
- ミクセルを考慮したNOAA-AVHRRデータのクラス分類アルゴリズム
- 可搬記録媒体からコピーされたファイルの残留検出を目的としたログ取得処理の検討(セキュリティ関係,一般)
- ランドサットETM+データを用いた鳥海山沿岸海域における地下水湧出地点の検出
- Balloon models を用いた認知症診断支援のための脳領域抽出法
- 可搬記憶媒体からコピーされたファイルの置き忘れ検出
- JSMRシステムによるPOSデータを用いた配送計画のシミュレーション
- 可搬記録媒体からコピーされたファイルの残留検出を目的としたログ取得処理の検討(セキュリティ関係,一般)
- 可搬記録媒体からコピーされたファイルの残留検出を目的としたログ取得処理の検討(セキュリティ関係,一般)
- シンクライアントによる教育用端末環境の構築(記念講演,教育システム)
- 口唇の形状情報を用いた口唇領域自動抽出処理の改善
- 形状情報を用いた口唇領域の自動抽出--発話に伴う口唇の時系列的な動きの活用
- ディレクトリの変更履歴およびハッシュ値に基づいた残留ファイルの検出手法
- 発話に伴う口唇の動き特徴を用いた心情変化の検出
- 情景画像の特徴を考慮した円形道路標識の抽出アルゴリズム
- 3C-6 アルツハイマー型認知症診断支援のための側頭葉領域の抽出法(画像処理・認識,一般セッション,人工知能と認知科学)
- 自己写像特性を用いた顔表情カテゴリーの抽出と感情空間マップの生成(画像認識,コンピュータビジョン)
- 顔画像の位相特性に基づいた表情空間マップの形成に関する検討(顔・ジェスチャの認識理解(2),顔・ジェスチャの認識・理解)
- 顔画像の位相特性に基づいた表情空間マップの形成に関する検討(顔・ジェスチャの認識理解(2),顔・ジェスチャの認識・理解)
- 顔の動的位相変化に着目した表情空間モデルの最適化に関する検討(文書・文字メディアの認識・理解, 一般)
- 顔の動的位相変化に着目した表情空間モデルの最適化に関する検討(文書・文字メディアの認識・理解, 一般)
- 雑音を含む音声信号と発話に伴う口唇の動き特徴を用いた個人識別(文書・文字メディアの認識・理解, 一般)
- 雑音を含む音声信号と発話に伴う口唇の動き特徴を用いた個人識別
- 脳スライス標本における電気刺激効果範囲の検討
- ファジィ推論によるミクセルのクラス混在率推定
- ファジィクラスタリングを用いたMRI脳画像の拡大手法
- 専門医の診断支援を目的としたMRI脳画像データセットにおける中心近傍画像選択法に関する基礎的検討
- 人物画像における重要度判定アルゴリズム
- 2W-9 違和感軽減に注目した背景差し替え法に関する検討(画像処理基礎,学生セッション,人工知能と認知科学)
- A-4-21 ホワイトバランスの変化にロバストな肌抽出法に関する検討(A-4.信号処理,一般講演)
- 口唇の動き特徴を用いた個人識別に関する検討(ヒューマンインフォメーション)
- 画像中の唇位置の自動推定--ズームと顔の向き変化に対応した唇位置の自動推定
- ズームと顔の向き変化にロバストな口唇位置の推定(文書・文字メディアの認識・理解, 一般)
- ズームと顔の向き変化にロバストな口唇位置の推定(文書・文字メディアの認識・理解, 一般)
- 109. 口唇形状抽出を目的としたファジィ推論における前件部メンバーシップ関数の自動設定に関する検討
- 局所フラクタル次元を考慮したアマゾン川中下流域におけるヴァルゼア域の推定
- 顔表情を対象とした感情特徴空間の生成--「快-不快」及び「覚醒度」を指標とした感情の定量化手法
- 顔の動的位相変化に着目した表情空間モデルの最適化に関する検討
- 顔の動的位相変化に着目した表情空間モデルの最適化に関する検討
- 時系列口唇画像を用いた読唇のための特徴抽出と唇の動き解析
- NOAA-AVHRRデータにおける地上基準点の自動抽出--ランレングス行列および近傍領域の特徴利用
- 情景画像の特徴を考慮した円形道路標識の抽出アルゴリズム
- J-022 液晶ディスプレイ上での色の切り換え表示におけるちらつきの発生要因に関する検討(ヒューマンコミュニケーション&インタラクション,一般論文)
- 4ZB-4 USBメモリを用いて持ち出されたファイルの置き忘れ検出に関する検討(セキュリティ(4),学生セッション,セキュリティ)
- 4W-7 車載カメラ取得データを対象とした円形道路標識の認識に関する検討(動画像・追跡,学生セッション,人工知能と認知科学)
- 認識・検出 情景画像の特徴を考慮した円形道路標識の抽出--明度情報の活用としきい値の自動設定
- 口唇の色彩情報および形状情報に着目した発話フレーム検出法 (特集 顔の情報処理)
- ファジィ推論によるミクセルのクラス混在率推定
- 拡張カルマンフィルタを用いた直流サーボモータのパラメータ同定
- ファジィ推論によるミクセルのクラス混在率推定
- 構成クラス数を考慮したファジィ推論によるミクセルのクラス混在率推定
- 108. カラー情景画像を用いた円形道路標識の情報抽出
- 1U-8 NOAA-AVHRRデータにおける地上基準点の自動抽出を目的とした特徴解析(画像処理システム,学生セッション,人工知能と認知科学)
- カラー情景画像における円形道路標識認識法
- カラー情景画像における円形道路標識認識法--色情報と形状情報を用いた円形道路標識の認識
- NOAA AVHRRを用いた局所領域における海面温度推定法 : 日本海における解析例
- 実行ファイルを用いた新規ソフトウェアの判別法
- 142. リサイクルを目的とした缶の自動識別に関する検討 : フォトリフレクタを用いた塗料の反射光強度の測定
- 4M-10 WWW上で公開される画像の複製防止法の検討
- ネットワーク上における画像データの複製防止の一手法
- 口唇の色彩情報および形状情報に着目した発話フレーム検出法
- クラス境界に位置する画素の画像分解アルゴリズム
- 発話に伴う口唇の動き特徴を用いた心情変化の検出
- ディレクトリの変更履歴およびハッシュ値に基づいた残留ファイルの検出手法
- 口唇の色彩情報および形状情報に着目した発話フレーム検出法
- ALOS AVNIR-2データを用いた鳥海山沿岸海域における地下水湧出地点の特徴解析
- 授業参観報告 : 北海道大学「蛙学への招待」
- 自動車故障診断システム構築における知識集約法
- 石油輸送配車スケジューリングシステム
- SAR画像を用いたリニアメントの自動抽出法の検討
- リモートセンシングデータを用いたリニアメント抽出のための線分要素解析
- リモートセンシングデータにおけるミクセルの画像分解アルゴリズム
- 河川堤防管理を目的とした有害植生の比率推定アルゴリズム(研究速報)
- 7-4 口唇の動きを用いた非接触コマンド入力インタフェースに関する検討(第7部門 ヒューマンインフォメーション1)
- 8-5 ディジタル画像を対象とする特定人物判別に関する検討(第8部門 画像認識・検索)
- 8-4 ディジタル画像における人物抽出に関する検討(第8部門 画像認識・検索)
- 11-3 口唇に着目した人物抽出に関する検討(第11部門 ヒューマンインフォメーション2)
- 11-6 経時データを用いた口唇の動き特徴解析(第11部門 ヒューマンインフォメーション2)
- 8-2 画像特徴を考慮した情景画像における看板内文字列領域の抽出(第8部門 画像認識・検索)
- ALOS AVNIR-2データを用いた鳥海山沿岸海域における地下水湧出地点の特徴解析
- 8-3 リモートセンシングデータを用いた鳥海山沿岸海域における地下水湧出地点の検出(第8部門 画像認識・検索)
- 11-4 口唇の動き特徴を用いたコマンド入力インタフェースに関する基礎的検討(第11部門 ヒューマンインフォメーション2)
- 11-2 顔表情の局所的特性を用いた表情解析法の検討(第11部門 ヒューマンインフォメーション2)
- 情報漏洩の防止を目的としたコピーデータ含有ファイルの残留検出手法
- J-035 自然表情の取得を目的とした情動と心拍の関連に関する検討(HIP(1),J分野:ヒューマンコミュニケーション&インタラクション)
- J-044 口唇の局所領域形状に着目した個人識別のための口唇形状グループ化法(HIP(2),J分野:ヒューマンコミュニケーション&インタラクション)
- J-045 口唇の動き特徴におけるばらつきに着目した喜びの感情検出に関する検討(HIP(2),J分野:ヒューマンコミュニケーション&インタラクション)
- A-15-6 口唇の動きにおける特徴点を用いたコマンド識別に関する基礎検討(A-15.ヒューマン情報処理,一般セッション)