絞り込み法による数式文字認識とその日本語/数式領域切出しへの応用
スポンサーリンク
概要
- 論文の詳細を見る
現在のOCRソフトは数式文字を含む科学技術文書には全く対応できていないため, 我々は, 日本語OCRを活用した数式OCRの開発を行った.本研究では, 日本語科学技術文書中の数式部の数学記号(英数字, ギリシャ文字を含む)の認識を念頭に置いた高速な文字認識手法を提案し, それを用いた日本語 / 数式領域分離手法の改良について報告する.日本語を認識するための日本語OCRエンジンと数式文字を認識するため独自に開発した高速数式文字OCRエンジンの二つのOCRエンジンを同時に走らせることで, 日本語 / 数式領域分離を正解に分離できる可能性を示した.我々が行ってきた従来の手法では, 日本語文字認識エンジンの内部情報である文字認識結果の信頼度などを多用していたため汎用性に欠けていた.この点を大幅に改良することで特定の日本語OCRエンジンに依存せずに数式を含む文書を認識することが可能となっている.
- 2000-03-25
著者
関連論文
- 2)OCRを用いた科学技術文書の自動点訳について(画像情システム研究会)
- OCRを用いた科学技術文書の自動点訳について
- OCRを用いた科学技術文書の自動点訳について
- アルファベットの部分パターンの線種の分類法について
- 1230 タイル先付けプレストレストコンクリートパネルの暴露試験
- 2次元ワープを併用したオンライン英数字・数学記号認識
- 数学記号の特徴を用いた数式の水平分割による数式構造解析
- 絞り込み法による数式文字認識とその日本語/数式領域切出しへの応用
- 最小コスト全域木探索を用いたオフライン数式構文認識
- ストロークの相互関係を用いたオンライン手書き数式認識
- 高速性を重視した数学記号認識とその数式を含む日本語印刷文書認識への応用
- When does the local density theorem imply the global one?
- 有限射影幾何におけるSpreadを用いたMaximal t-Linearly Independent Setの構成法 (デザインの構成と解析)
- Maximal t-Linearly Independent Setの幾何学的構成法 (デザインの構成法および不存在性)
- 1306 コンクリートの圧縮クリープの予測式に関する研究(収縮・クリープ(2),材料施工)
- 114 国内の実験データに基づいた時間依存性ひずみの予測式に関する研究 : その2.クリープひずみの予測式(材料・施工)
- 113 国内の実験データに基づいた時間依存性ひずみの予測式に関する研究 : その1.乾燥収縮ひずみの予測式(材料・施工)
- 接合面に凹凸を付けたコンクリートのせん断応力伝達性能に関する研究
- 1334 風速と風の当る時期がモルタルの接着強度に及ぼす影響
- 複数の順位情報に基づく評価関数の推定
- 科学技術文書における線図形の認識
- 115 コンクリートの時間依存性ひずみの統計的性質に関する研究 : その4.乾燥収縮データに対する理想曲線の不適合検定(材料・施工)
- 1144 コンクリートの乾燥収縮ひずみの予測式に関する研究 : その1.普通強度のコンクリート(収縮(2),材料施工)
- 1139 時間依存性ひずみの統計的性質に関する研究 : その2.乾燥収縮ひずみの定数変化法的推測(収縮(2),材料施工)
- 134 時間依存性ひずみの統計的性質に関する研究 : その3.乾燥収縮ひずみの定数変化法的推測(材料・施工)
- 1057 時間依存性ひずみの統計的性質に関する研究 : その1.乾燥収縮ひずみデータの平滑化(収縮・クリープ(2),材料施工)
- 140 時間依存性ひずみの統計的性質に関する研究 : その2.乾燥収縮ひずみデータの平滑化(材料・施工)
- 高校数学用の手書き図形認識システム(一般セッション(6))(ユビキタスコンピューティングのためのパターン認識・理解)
- 1020 コンクリートの微視構造再現シミュレーション : その1 球体骨材要素の骨組みの解析(表面性状・その他, 材料施工)
- 123 個別要素法によるコンクリートの微視構造再現シミュレーション : その1 球体骨材による骨組みの体積の解析(材料・施工)
- 1305 時間依存性ひずみの統計的性質に関する研究 : その3.乾燥収縮データに対する理想曲線の不適合検定(収縮・クリープ(2),材料施工)
- 時間依存性ひずみの統計的性質に関する研究 : その1.乾燥収縮ひずみの測定データに含まれる誤差成分
- 1411 歪追従性による接合面の性能評価