OCROpUSを用いた数式を含む科学技術文献の読取りシステム(テーマセッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,オープンソースのOCRソフトであるOCROpUSへの数式認識モジュールの組込みを目的とし,本稿では特にインライン数式の抽出を取り扱う.数式を含むテキストラインを単語単位に分割し言語モデルとの照合を行えば,数式部分と通常の単語とをかなりの正確さで区別できる.また,数式は文字の外接矩形のアスペクト比がばらつく傾向があるため,外接矩形に関連する特徴量を用いてSVMによる識別を行い,数式の抽出率を高めている.
- 2013-03-07
著者
関連論文
- カラー画像平滑化のための色線形性を考慮した異方性拡散(画像)
- 3Dモデル形状とテクスチャ品質保持のためのメッシュパラメータ化(コンピュータグラフィックス(CG)基礎)
- 3Dモデル形状復元のための頂点周辺密度均一化によるパラメータ化(高精細画像の処理・表示,及び一般)
- 3Dモデルの高速な円筒ジオメトリ画像化法(コンピュータグラフィックス(CG)基礎)
- 小切手磁気インク文字読取のための背景およびサイン除去(テーマセッション3,複合現実感のためのパターン認識・理解)
- カラー情景画像からの文字抽出高精度化の一検討(テーマセッション6,文字・文書の認識・理解)
- 3Dモデル形状復元のための頂点周辺密度均一化によるパラメータ化
- 3Dモデル形状復元のための頂点周辺密度均一化によるパラメータ化
- フラッシュ画像とノンフラッシュ画像の色彩と陰影の変換による鮮鋭画像生成法(画像応用技術,時空間映像処理,画像符号化及び一般)
- 複数の一次元エッジから推定されるPSFを用いた手ぶれ除去(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 複数の一次元エッジから推定されるPSFを用いた手ぶれ除去(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 複数の一次元エッジから推定されるPSFを用いた手ぶれ除去(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- ウェーブレット変換による合焦画像の作成(画像)
- フラッシュ画像とノンフラッシュ画像の色彩と陰影の変換による鮮鋭画像生成法(画像)
- OCRソフトOCRopusへの数式認識モジュールの組込みの検討(テーマセッション,文字・文書の認識と理解)
- 合焦位置を起点とした文字列抽出の一検討(テーマセッション,文字・文書の認識と理解)
- パッチ分割を用いたイメージモザイキング
- パッチ分割を用いたイメージモザイキング
- パッチ分割を用いたイメージモザイキング
- 階層化的ブルームフィルタを用いた安全で効率的なキーワード検索法(データ工学,Web情報システム)
- OCROpUSを用いた数式を含む科学技術文献の読取りシステム(テーマセッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
- フラッシュ画像を用いたノイズ除去に関する一検討(無線通信のための信号処理及び一般)
- フラッシュ画像を用いたノイズ除去に関する一検討(無線通信のための信号処理及び一般)