3次元情報を利用した画像符号化に関する研究(パターン理解)(<特集>人工知能分野における博士論文)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,マルチメディア通信システムにおいて大容量化する画像に対して有効となる,画像符号化手法や3次元情報抽出手法を論じた.まず,モデルベース符号化における3次元人物モデル解析の手がかりとして,画像から複雑な輪郭を自動抽出・追跡する手法について述べた.本手法では人間が概略的な初期輪郭を与える輪郭抽出法と異なり,計算機によりエッジ画素を連結して初期輪郭を得た.連結の判断には赤池の情報量規準を用い,輪郭セグメントモデルに対するエッジ画素の情報量が小さくなるよう連結した.2フレーム目以降では,動的輪郭法を用いた結果に新しく出現したエッジ画素を加えて再度情報量を評価した.実験で,は計算機により自動的に輪郭を抽出・追跡できることを確認し,モデルベース符号化に有効であることを示した.次に,多視点画像の高能率符号化について述べた.多視点画像を高能率に符号化するために,多視点画像から複数の代表画像(テンプレート)を選択し,テンプレートを用いてその近傍視点画像を予測符号化した.テンプレートの選択には符号量を基準にしたクラスタリング法を用いた.また,予測符号化における動きベクトルの符号化効率を高めるため,画像間のエピポーラ幾何拘束を用いて2次元動きベクトルを1次元に拘束した.エピポーラ幾何推定手法には,ブロックマッチングの結果をエピポーラ幾何パラメータによる非線形関数により表現し,ロバスト推定によりパラメータを推定した.比較実験により,多視点画像を高能率に符号化できることを示した.
- 社団法人人工知能学会の論文
- 2005-01-01