日本語の発話映像における初口形の検出方法提案
スポンサーリンク
概要
- 論文の詳細を見る
情報処理技術を利用して,読唇を実現しようとする研究("機械読唇"と呼ばれる)が進められている.著者はこれまで,実際に読唇の技能を身につけている読唇技能保持者が,話し手の発話中に断続的に形成される特徴的な口形から,読唇を可能にしていることに着目し,その特徴的な口形を計算機上で処理するためのコード化や,発話映像から終口形と呼ばれる口形を検出する方法について提案してきた.本論文はその提案に続くもので,話者の発話中に形成される"初口形"と呼ばれる口形の検出方法について提案する.本提案では,テンプレートマッチングを利用して発話映像から特徴的口形を検出する際,初口形が形成される時点で,その類似度データの波形に特徴的な形が表れることを確認した.
- 2012-04-15
著者
関連論文
- 利用者の求める情報と閲覧環境を考慮した自治体情報提供システム : 愛知県マルチメディア・モデル市役所展開事業(ネットワークサービス, ユビキタス社会におけるコラボレーションサービス)
- J-020 BPCSステガノグラフィにおける複雑領域分割のための閾値設定と下位ビット置換に関する評価(J分野:グラフィクス・画像)
- SVGグラフィックスとGoogle Earthを用いた在学生の出身高校情報マップの開発
- K-025 口形順序コードを用いた発話映像自動生成方法(K分野:教育工学・福祉工学・マルチメディア応用,一般論文)
- A-19-7 発話映像中の初口形検出方法の提案(A-19.福祉情報工学,一般セッション)
- 日本語発話時の特徴的口形のコード化と口形変化情報表示方法の提案
- 1F-6 発話映像から導出した特徴的口形の機械読唇への適用評価(知的ヒューマンインタフェース,一般セッション,インタフェース)
- 日本語発話時における口形変化のコード化表現方法の提案と評価
- RK-002 日本語発話時における口形変化のコード化の提案(教育工学・福祉工学・マルチメディア応用,査読付き論文)
- 6E-2 特徴的口形に着目した日本語発声時の口唇形状変化のコード化表現に関する研究(ことばと文化,一般セッション,インターフェース)
- 遺伝的プログラミングを用いた疑似生態系におけるマルチエージェントの行動パターンの進化
- RL-001 複数ユーザ間のユーザ登録情報共有による個人情報自動入力ソフトの開発(ネットワーク・セキュリティ,査読付き論文)
- B-006 電子書籍フォーマットに対応した書籍管理ソフトウェア(ソフトウェア,一般論文)
- 1Q-2 ICカードを利用したWebフォームヘの登録内容入力支援ソフトの開発(ユーザ支援,学生セッション,データベースとメディア)
- D-4-17 タグを用いた書籍ファイル管理システム(D-4. データ工学,一般セッション)
- DNA計算における分子数低減のための塩基配列設定方式の実験
- 日本語の発話映像における初口形の検出方法提案
- Android端末を用いた読唇トレーニングアプリの試作と評価