文書理解における論理構造抽出の一手法
スポンサーリンク
概要
- 論文の詳細を見る
一般に,文書には章・節等の意味的な構造を表わす論理構造,および,ページ内の印刷上の配置を表わす割付け構造がある。文書の内容を読者に正確かつ迅速に読者に伝えるため,これらの構造が有効に用いられる。特に,情報価値が高いと考えられる文書は,これらの構造を明確にしてある場合が多い。たとえば,学術論文や特許明細書などが,これに相当する.ハイパーテキストの出現などを見てもわかるように,計算機における文書処理においても,構造を用いた目次の自動生成,インデックス情報の付加など高度な文書の利用が要求されている。このため,既存の紙面イメージの文書についても,構造を付加することが要求されている。これまで,文書画像の書式(割付け構造)に着目し,内容を解析する方式を報告してきた。今回,文書画像から文書の論理構造を抽出する方式を検討し,基礎的な実験によって有効性を確認したので報告する。
- 一般社団法人情報処理学会の論文
- 1988-09-12
著者
-
村上 達也
(株)日立製作所 中央研究所
-
藤澤 浩道
(株)日立製作所中央研究所
-
嶋 好博
(株)日立製作所中央研究所
-
屋代 寛
(株)日立製作所 中央研究所
-
中野 康明
(株)日立製作所 中央研究所
-
東野 純一
(株)日立製作所システム開発研究所
-
屋代 寛
(株)日立製作所中央研究所
-
藤澤 浩道
(株)日立製作所
-
東野 純一
(株)日立製作所 中央研究所
-
中野 康明
(株)日立製作所
関連論文
- 情報のら旋形成長を支援するコミュニケーション形電子図書館
- ハイパーメディア共有アーキテクチャ
- ハイパーメディア共有アーキテクチャにおけるバージョン管理方式
- 仮想個人図書館の構築を支援するユーザインタフェースの開発
- D-11-93 文書画像に対する適応型 2 値化の一手法
- I-85 帳票画像からの下線抽出の一手法(画像レイアウト解析,I.画像認識・メディア理解)
- D-12-60 帳票画像からの点線抽出の一手法
- 刊行物目次解析のための書誌情報表現の分析
- 文字と交差した罫線の除去方式の一提案
- 細分化クラスタ法によるパタンマッチングの高精度化
- 逐次型階層的クラスタリングによる大量学習の一手法
- 認識機能の出力あいまい性を許容した情報検索手法の一検討 : 認識誤り特性に着目した検索手法の分析評価
- 表罫線の交差部におけるかすれ補正方式の一提案
- 表記規則を持った数字列の一認識方法
- 文書認識と全文検索の融合技術に関する実験的検討
- 構造特徴による前分類を用いたニューラルネットワークのパターン認識能力の検証
- 端点対接続型かすれ修復方法の手書き線図形認識への適用
- 表記規則を持つ数字文字列の認識における文字列チェック機能の一検討
- 手書き線図形のかすれ修復方法の一提案
- OCR誤認識後処理の効率化 : 補単語抽出方法と動詞活用処理を中心に
- 手書き漢字住所認識のためのエラー修正アルゴリズム
- 棒状図形に傾き検出のラン符号による高速化の一手法
- オートマトン型単語照合の姓名文字列への適用
- 文書の見出し記号の解析に基づく木状論理構造生成の一手法
- 文書画像理解における論理構造抽出の一方式
- 手話自動翻訳システムにおけるパターン認識・合成
- トライ辞書を用いた語彙情報駆動型の印刷地名単語列認識方式(画像処理,画像パターン認識)
- チェックライタ金額文字列認識の一手法
- 金額文字列認識の後処理のためのボトムアップ型構文解析の一手法
- 単語探索型の文字列認識方式
- 超並列計算機の文字認識辞書構築処理への応用
- 自由語検索のための高速文字列検索方式
- 自由語検索のための同義語・異表記展開方式
- 自由語による全文検索のためのテキストサーチマシンTSM-I
- 同期機構付き分散共有メモリの提案
- ハイパーメディア共有アーキテクチャ
- キーワードの統計分布情報を用いた文書の多重分類システム
- 日本語情報処理の諸相 : 日本語情報検索技術の系譜(日本の情報処理技術の足跡)
- 「仮想個人図書館」と個人情報環境
- 3. 情報検索における自然言語処理 ( 自然言語処理技術の応用)
- Bayesルールを用いた宛名記載領域抽出手法(文字とドキュメントの認識・理解)
- Bayesルールを用いた宛名記載領域抽出手法(文字とドキュメントの認識・理解))
- ベイズルールを用いた周辺情報統合による手書き漢数字の文字切出し手法(画像処理,画像パターン認識)
- 中国における文字認識の現状と将来
- 手書き文字認識における学習型2次識別関数
- 手書き文字認識における学習型2次識別関数
- 多重仮説方式を用いた宛名記載領域抽出手法
- 住所表示番号と棟・部屋番号の連続表記に対する照合方式
- D-12-19 縦横混在表記に対する住所表示番号照合方式
- 表記パターン知識を用いた住所表示番号照合方式
- 手書き接触漢字切出しに関する検討
- Bayesルールを用いた手書き漢数字の文字切出し手法
- 特許CD-ROMライブラリ検索システム
- 文書理解における論理構造抽出の一手法
- 6)文書理解の一方式とその応用(視覚情報研究会)
- 自動ファイリングのための文書理解の一方式
- 文書理解の一方式とその応用
- 知的ファイリングモデルシステムの開発(その3) : 自動ファイリングのための文書理解の一方式
- 知的ファイリングモデルシステムの開発(その1) : システムの設計思想と実現方法
- OS/omicron第2版のアーキテクチャ
- 文書ブラウジングにおけるヒューマンインターフェース
- 知的ファイリングモデルシステムの開発(その4) : 検索効率向上のためのイメージ表示方法
- 知的ファイリングモデルシステムの開発(その2) : 自由語検索における異表記、異表現解消法
- 手書き文字の認識技術 (文字認識)
- 印刷文字認識における位置ずれ補正の効果
- 周波数領域での階層的パタ-ン整合法による漢字認識
- 電子図書館システムの技術動向
- 部品・参照の編集を支援する構造化文書エディタの提案
- SDAIRに見る文書解析と情報検索に関する研究状況
- SDAIRに見る文書解析と情報検索に関する研究状況
- オートマトン型単語照合の高速化手法
- 差分DTD生成型の構造化文書差分抽出方式
- 単語を単位とした文書間差分抽出方式およびその高速化手法
- 日本語文字読取装置(最近の入出力端末機器)
- 溝口理一郎著, 知の科学-オントロジー工学, 人工知能学会編集, 275頁, オーム社, 2005
- 知的ファイリングシステムのビジュアルインタフェース
- 部分パタ-ンマッチングにおける標準パタ-ンの選択方式
- 部分画像の出現確率を用いた高速化パタ-ンマッチング方式
- ランに対する座標演算に基づく2値画像の高速回転のための一手法
- 電子部品の捺印パタ-ン欠陥検出手法の一考察
- 部分画像の並列切出し照合方式に基づく捺印パタ-ンの欠陥検出
- B-8 SGML文書の変換・再利用のための言語"AEsop"(文書構造・SGML)