特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
スポンサーリンク
概要
- 論文の詳細を見る
明朝体・ゴシック体等の標準フォントに対して形状が大きく異なるフォントの文字や、画像状態が劣悪で変形の著しい文字は、文字認識精度が大幅に低下する。そこで、文字パターン集合の変動傾向を差分分布という統計量によって捉え、その情報を従来の擬似ベイズ識別関数に組み込んで認識を行う、学習擬似ベイズ識別法を提案する。具体的には、入力画像を一度認識したあと、認識の正読確率によって正解文字を推定し、それらから差分分布を取得する。そして、その差分分布を用いてカテゴリの固有値.固有ベクトルを補正し、擬似ベイズ識別を行う。文字パターン集合に関する変形の相関を表す差分分布を、パターン変形に有効な識別手法として知られる擬似ベイズ識別関数へ統合することにより、パターンの変形に則したより高精度な認識が可能となる。様々なフォント文書や、圧縮カラー文書やFAX文書などの劣化文書に対して評価実験を行い、認識率が従来法に比べ大きく向上することを確認した。
- 2002-07-11
著者
-
勝山 裕
株式会社富士通研究所
-
直井 聡
株式会社富士通研究所
-
黒川 浩司
株式会社富士通研究所:富士通研究開発中心有限公司
-
武部 浩明
富士通研究所
-
直井 聡
富士通研究所
-
武部 浩明
株式会社富士通研究所
-
勝山 裕
富士通研究所
-
黒川 浩司
富士通研究所
関連論文
- Webサーチを活用したTVテロップ認識率向上手法(一般,膨大なデータから学ぶもの)
- Webサーチを活用したTVテロップ認識率向上手法(一般,膨大なデータから学ぶもの)
- テロップ文字パターン抽出の一検討(テーマセッション6,文字・文書の認識・理解)
- 文字認識技術を利用した講義動画のスライド同定--文字配置の類似度によるスライド同定方式と講義動画のスライド同定作業コストの削減効果
- スキャナで取得した画像におけるポストプリント・パターンのインク色と背景色との混色及びその補正に関する一考察 (パターン認識・メディア理解)
- 講義講演シーン検索におけるレーザポインタ情報の活用法(コンテンツ技術,データ工学論文)
- D-11-108 プレプリント接触数字認識の一方式
- 音声情報を統合したプレゼンテーションコンテンツ検索(情報検索,データ工学論文)
- 文書間の色一様性に基づく文書画像群からの機密パターン抽出(ソフトコンピューティング及び一般)
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング(e-Learning,夏のデータベースワークショップDBWS 2006)
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング(e-Learning)
- 講演シーン検索における検索語出現状況に基づくレーザーポインタ情報のフィルタリング
- 二値化閾値の補正と罫線形状判定による罫線抽出の高精度化(テーマセッション1,文字・文書の認識・理解)
- 平行測地線からの形状復元によるデジカメ文書画像の歪み補正(テーマセッション3(文字画像処理2),文字・文書の認識・理解)
- D-12-146 認識誤りに対応した単語抽出方式(D-12.パターン認識・メディア理解,一般講演)
- D-12-141 文字ペア特有の識別情報を使用した類似文字認識に関する一検討(D-12.パターン認識・メディア理解,一般講演)
- D-12-30 消失点検出にハイブリッド手法を用いた携帯デジカメ撮影画像のための透視歪み補正(D-12.パターン認識・メディア理解,一般講演)
- e-文書・内部統制向け文書画像認識技術 (特集 研究開発最前線)
- 確率伝搬法を用いた帳票の論理構造認識に関する一方式
- D-12-88 文字列抽出用/図表抽出用の2種類の2値化方式を使用したカラー文書画像レイアウト解析手法(D-12.パターン認識・メディア理解,一般講演)
- D-12-86 混色と薄い色使いにも強いカラー帳票レイアウト復元手法(D-12.パターン認識・メディア理解,一般講演)
- D-12-65 複数の処理結果統合によるテキストブロック抽出手法(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-42 仮説検証に基づく再帰的テキストブロック抽出手法(D-12.パターン認識・メディア理解A)
- D-11-94 平行測地線からの形状復元による画像歪み補正についての一検討(D-11.画像工学D)
- D-12-80 デジタルカメラと電子ペンを用いた紙情報入力についての一検討
- ディジタルカメラ画像からの罫線抽出の一方式
- D-12-19 非接触入力による濃淡画像からの罫線抽出方式
- テロップ情報による語学番組シーン検索手法の評価
- 文字認識技術を利用した講義動画のスライド同定(画像・映像処理)
- メディア工学シンポジウム聴講報告
- 14-7 マラソン放送番組における画像処理の応用 : 走者のピッチ、ストライド計測システムの開発
- 企業から個人のためのOCRへ
- D-11-65 信頼性の高い文字要素を利用した帳票画像からの行抽出処理(D-11. 画像工学,一般セッション)
- 形態素解析とキーワード領域内の候補文字ラティス情報を用いた単語照合による文書画像の高精度検索方式(画像検索, 画像の認識・理解論文)
- 講義ビデオ中のレーザーポインタ抽出の一検討(文字とドキュメントの認識・理解)
- 講義ビデオ中のレーザーポインタ抽出の一検討(文字とドキュメントの認識・理解)
- e-ラーニング向け講演ビデオ複合コンテンツの作成支援 : 動画とスライドの対応付けとポインティング情報抽出(INFOSTAシンポジウム2003一般発表)(INFOSTAシンポジウム2003)
- 文字と画像のマッチチングを用いた講義動画中のスライド同定
- D-12-69 講義動画中のスライド同定を利用したレーザーポインタの同期表示
- 講義講演シーン検索における音声データの利用(eラーニング1, 夏のデータベースワークショップDBWS2005)
- 講義講演シーン検索における音声データの利用(eラーニング1, 夏のデータベースワークショップ2005)
- スキャナで取得した画像におけるポストプリント・パターンのインク色と背景色との混色及びその補正に関する一考察(テーマセッション,文字・文書の認識・理解)
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- ラベル画像の階層的矩形表現を用いた罫線抽出方式
- 6ZN-3 語学番組検索システムにおけるシーン区切り検出手法(情報爆発時代におけるマルチメディア処理,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- D-12-50 マークパターンが重畳された文字に対する認識方式(D-12.パターン認識・メディア理解,一般セッション)
- 文字特徴からの特徴合成に基づく単語一括認識(画像認識, コンピュータビジョン)
- クラスタリングによる個人筆記特性に基づく数字認識の改善方式
- 文字特徴からの特徴合成に基づく動的単語一括認識
- 文字特徴からの特徴合成に基づく単語一括認識
- D-12-17 連続DPを用いた英数接触活字の切り出しと認識
- セグメンテーションの負荷を軽減した手書き住所認識
- セグメンテーションの負荷を軽減した手書き住所認識 : 接触文字の分離機能を持つキー文字抽出方式
- セグメンテーションの負荷を軽減した手書き住所認識
- 種々の画像特徴を用いた手書数字の訂正線判定方式
- クラスタリングによる個人筆記性を用いた文字認識方式
- GIM法による表形式枠接触文字の分離
- GIM法による枠接触文字の高品位分離
- テクスチャ領域を含む帳票画像からの罫線抽出(テーマセッション2(文字画像処理1),文字・文書の認識・理解)
- 統合プレゼンテーションコンテンツ蓄積検索システムの試作(マルチメディア情報検索, データ工学論文)
- D-32 教育コンテンツを対象とした情報統合における利用者インタフェース(ネットワークサービスとDB,D.データベース)
- 枠接触文字分離法『GIM』の改良 : ループ形状特徴の評価の追加
- 文字仮説の多重生成による帳票画像からの単語抽出方式(テーマセッション1,文字・文書の認識・理解)
- 複数セル候補の組み合わせ探索に基づく帳票画像からのセル抽出(テーマセッション,文字認識・文書理解)
- 複数セル候補の組み合わせ探索に基づく帳票画像からのセル抽出(テーマセッション,文字認識・文書理解)
- D-12-64 形態素と候補文字情報を用いた文書画像の高精度検索方式
- D-12-14 特徴ベクトルの差分分布の利用に基づくフォントフリー文字認識手法
- 特徴領域の射影推定による高速高精度な大分類方式
- 図書の電子化のための文書認識技術 (特集 電子図書館を支える技術)
- 圧縮文字特徴と原特徴を併用した高速かつ高精度な文書認識方式
- 枠接触文字の分離法『GIM』の評価 : 文字の位置ずれと枠の雑音,線幅変動の影響
- GIM法による枠接触文字の分離効果
- 枠接触変動と認識の信頼度に関する知識獲得による枠接触文字の分離法GIM-II
- 枠接触文字の分離法『GIM』の評価 : 文字線分の連続性/不連続性による復元効果
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法 (パターン認識・メディア理解)
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法 (データ工学)
- LI-5 文字認識を利用した講義動画中のスライド同定(I. 画像認識・メディア理解)
- D-12-20 カラー文書のモアレモデルを用いた高速文字パターン抽出法
- 背景模様付き見出しからの文字列抽出 : 連結成分の組合せの認識評価による抽出
- ビジネス文書を対象としたキ-ワ-ド自動抽出技術
- 未知文書とモデル文書の基準罫線対を適応的に用いる高精度高速フォーム識別方式
- ビジネス文書における高速タイトル抽出方式
- e-ラーニング向け講演ビデオ複合コンテンツの作成支援--動画とスライドの対応付けとポインティング情報抽出 (INFOSTAシンポジウム2003--情報サービスソリューションに向けて)
- 文字認識と画像マッチングを利用した講義動画のスライド同定
- D-12-25 判別分析を用いた手書き文字と活字の判別方法
- 文字の形状特徴を利用した可変ウィンドウサイズによる高速ラベリング手法
- 交点追跡と全体最適化に基づく罫線抽出誤りに頑強な表項目セル抽出(画像認識,コンピュータビジョン)
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- デジタルペンを活用したグループワーク電子化支援システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- デジタルペンを活用したグループワーク電子化支援システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- デジタルペンを活用したグループワーク電子化支援システム
- デジタルペンを活用したグループワーク電子化支援システム