文書画像のSGML文書への変換に関する一検討
スポンサーリンク
概要
- 論文の詳細を見る
近年,文書情報の蓄積形式としてSGMLが注目を集めている.しかし既存の文書をSGML文書へ変換するには多大な労力を必要とする.文書画像をSGML文書へ変換する方法としては,文書のレイアウトに着目して画像から構成要素領域を抽出するアプローチが提案されている.しかしながら,従来手法では,例えば論文フロントページの著者名領域などおおまかな領域を抽出するのみで,個々の著者名や著者名から所属機関名への対応づけなど文書データベースの作成に必要な情報を抽出するまでには到っていない.そこで,パターン分類に基づいた構成要素の領域抽出手法と構成要素ごとの構造化処理により,文書画像をSGML文書へ変換する手法を提案する.科学技術論文を対象とした実験により,著者名から所属機関名への対応づけや章題,パラグラフの抽出等に有効であることを確認した.
- 社団法人電子情報通信学会の論文
- 1994-09-22
著者
関連論文
- 仮想アドレスを用いたプライベートネットワーク間相互通信方式(アクティブネットワーク, IP-VPN, ネットワークセキュリティ, 超高速ネットワーク, P2P通信, ネットワークソフトウェア, 一般)
- 学術論文誌データベース化プロトタイプシステムの構築
- A-7-30 IC カード AP のダウンロード管理及び更新方式の一検討
- 文書レイアウトに着目した学術論文誌からのSGML文書生成システム
- パターン分類手法に基づく文書画像の構造解析
- パターン分類手法に基づくレイアウト解析
- サービス指向アーキテクチャにおける相互認可モデル
- オンデマンドVPNシステムの実装と評価(モバイルコンピューティング,ユビキタス社会を支えるコンピュータセキュリティ技術)
- 仮想アドレスを用いたプライベートネットワーク間相互通信方式のオンデマンドVPNへの適用(セッション3-B:ネットワークセキュリティ(2))
- 仮想アドレスを用いたプライベートネットワーク間相互通信方式のオンデマンドVPNへの適用(セッション3-B:ネットワークセキュリティ(2))
- 商標の類似度に関する一検討
- 編集にあたって(e-ビジネスを実現するソフトウェアサービス技術)
- 文書画像の入力ノイズに耐性のある電子透かし法の一検討
- 文書画像構造解析のための知識ベースの一構成法
- 意味情報に基づく検索と全文検索の統合
- 意味情報に基づく検索と全文検索の統合
- Dusk View を用いた時空間断片情報の視覚化
- レレバンスフィードバックにおける検索語の共起関係推定処理の高速化
- 情報の電子化技術−入門から応用まで : 印刷物の電子化技法−OCRとデジタイザの活用
- アクセス制御機能付DNSの実装と評価(セッション2B ネットワーク技術とセキュリティ)
- DNSにおけるアクセス制御プロトコルの検討
- DNSにおけるアクセス制御プロトコルの検討
- DNSにおけるアクセス制御プロトコルの検討
- M-101 DNSにおける信頼性情報付与のためのチェック方式の検討(ネットワークセキュリティ,M.ネットワーク・モバイルコンピューティング)
- レイアウト解析による文書画像分類法の検討
- 表の領域情報に基づく帳票識別法の検討
- 文書認識処理の高速化を指向した専用ハードウェアの検討
- 周辺分布の高周波成分に着目した帳票識別法の一検討
- 文書画像のSGML文書への変換に関する一検討
- 電子政府実現に向けての欧州の取り組み
- 文書画像におけるゴシック書体文字の抽出 (画像の認識・理解)
- 文書画像におけるゴシック書体文字の自動抽出
- 部分構造の類似性に着目した文書画像の構造解析
- 構造の類似性に着目した対話型の非定型文書解析手法
- LN-4 複数サービスが利用する個人情報に関する管理方式の検討(N. 教育・人文科学)
- ペーパーレスは実現するか