文書理解におけるベイズ推論(文書・文字メディアの認識・理解, 一般)
スポンサーリンク
概要
- 論文の詳細を見る
近年, オンライン, オフライン双方の文書理解において, ベイジアン・アプローチは基本的な推論技法として一般的になりつつある.ベイジアン・アプローチは, 画像強調, 構造モデル化, モデルに基づく照合, 統計的言語モデルに基づく後処理, さらには多識別器の組み合わせなど, 文書解析・理解のほぼ全ての処理に適用されている.適用の際の具体的な枠組みとしては, 隠れマルコフモデル, ベイジアンネット, マルコフ確率場モデルなど, 様々なものがある.本講演では, 統計的ストローク解析を用いたオンライン, オフライン文字認識に対するベイジアンネットの利用について詳しく述べる.東洋文字の認識における構造解析の有効性を考慮し, 我々は, ストロークの形状とストローク間の関係について統合的な確率モデル化を行っている.このモデル化は, 構造解析と統計的アプローチを, 両者の利点を保ったまま統合するという美しい枠組みとなっている.点-ストローク-文字の階層構造, ならびにこの構造の統計的依存関係を用いて, 文字はベイジアンネットによってモデル化される.これにより, ナイーブベイズ法のモデル化の粗さや, 力ずくのベイジアン・アプローチの計算量に関する問題点を克服している.また, ベイジアンネットを用いることによって, 文字の形状とストローク間の関係はデータから学習可能であり, さらに解析の結果として確率値を得ることができるため, 後の解析や他手法との統合に有益である.また本講演では, KAISTで研究されている様々な方法論や革新的なアプリケーションについて, 最近, あるいは現在進行中のものを簡単に紹介する.方法論としては, 超解像による例に基づくベイジアン画像強調, 依存関係を考慮した多識別器の組み合わせ, 東洋言語コーパスを用いた統計的言語モデルについて述べる.また, アプリケーションとしては, 電子図書館のための古文書解析, 3次元空間に文字を書くというインタフェースについて述べる.
- 2005-03-10