文書画像データからの書誌情報の抽出とマッチング
スポンサーリンク
概要
- 論文の詳細を見る
電子図書館は、全文データや画像データなどの大量のデータを持ち、関連のあるデータの間にリンクを張るなどのデータの加工が必要である。大量のデータに対して、このような作業を人手で行なうことはほとんど不可能で、なんらかのデータベース構築支援メカニズムが必要になる。本稿では、電子図書館において学術文献の参照関係に対応するハイパーリンクを作成するための書誌照合手法を提案する。この手法のポイントは、文書画像処理によって得られたエラーを含む書誌データに対して高速な照合を精度良く行なうところにある。提案される手法は、非連続N-gramを用いて大規模書誌データベースから候補レコード集合を高速に選び出す近似書誌照合と最長共通部分文字列を用いた類似度に基づく候補レコードの評価の2つのステップから構成される。本稿では、提案される手法がOCRの各種の認識誤りに対応できることを示す。
- 1997-05-15
著者
関連論文
- オンラインジャーナル編集・出版システムの開発
- 語の出現位置の視覚的記憶に基づく既読文書の問合せに於ける索引構造の考察
- オンラインジャーナル出版システム
- 入力要素を保存する集約に基づくビューへの問合せ最適化手法
- 産学連携に関するWeb情報の分析 : 大学サイトの事例研究(第17回(2009年度)年次大会(研究報告会&総会))
- 論文情報ナビゲータの構築(セッション5 : 文書データベース)
- 「マルチメディア情報べース技術の研究」が目指すもの (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 単語間の係受け情報を用いた文献検索手法
- 単語間の係受け情報を用いた文献検索手法 (システム分野)
- 表題の意味構造を考慮した文献検索手法
- 情報検索サービスNACSIS-IRの新たな展開 (情報検索の新潮流)
- 学術情報環境の変化に対応する学術出版の道しるべ SIST 07/08の改訂による学術雑誌・学術論文の新たな作成基準
- 総合目録オンラインDBと情報検索システムの連携方式 (学術情報分野)
- 学術情報センターにおけるオンラインDBとIRシステムの連携 : 目録系データベースの構成
- インターネットに適応した全文データベース検索システムの拡張 : 文書画像データへのアクセス:鹿児島大学教養部紀要を例として
- 大型計算機センター群の共通利用番号制の運用と実現方式について
- 大型計算機センター群の共通利用番号システムのネットワークプロトコルについて
- 大型計算機センター群の共通利用番号システムの基本概念について
- オンラインジャーナル出版システム
- 文献の論理構造を考慮した全文検索システム
- 東洋医学と情報処理 (第50回日本東洋医学会学術総会)
- Web Page Classification Based on Surrounding Page Model Representing Connection Type and Directory Hierarchy
- Combining Page Group Structure and Content for Roughly Filtering Researchers' Homepages with High Recall (特集:情報融合)
- Framework for Building a High-Quality Web Page Collection Considering Page Group Structure
- Framework for Building a High-Quality Web Page Collection Considering Page Group Structure
- 大規模データベースを利用したリンケージシステムの提案と実装
- 4P-3 英文曖昧検索へのHMMの適用とその評価
- OCR認識誤りの学習方法について
- 英文曖昧検索における拡張検索文字列数の削減
- 認識誤りを含む和文テキストにおける全文検索手法
- 英文認識誤り特性に基づいた曖昧検索手法
- 文字誤りを含む英文検索手法
- 認識誤りを含むテキストにおける検索手法 (システム分野)
- 統計的手法による文字誤りテキスト検索
- 誤りを含むテキストにおける検索の一手法
- NACSIS-IRの検索機能の高度化
- 周辺ページを活用したウェブページコレクションの効率的な構築
- Web データを対象としたナビゲーション指向検索用テストコレクション─ 設計と特性
- B-treeの分散配置とその性能評価
- レコード同定問題に関する研究の課題と現状(データ工学論文)
- SAIKAM : インターネット上での協調的な対訳辞書構築環境の実現
- インターネット上の協調対訳辞書構築プロジェクト"SAIKAM"
- インターネット上の協調対訳辞書構築プロジェクト "SAIKAM"
- 複合的メタデータによる文化情報資源へのアクセス可能性の提示(セッション3,学生チャレンジ特集)
- 複合的メタデータによる文化情報資源へのアクセス可能性の提示(テーマ:学生チャレンジ特集)
- 編集にあたって
- 特集「情報融合」に向けて
- 編集にあたって
- 編集にあたって
- 編集にあたって
- 編集にあたって
- 特集「情報融合」に向けて
- 編集にあたって
- オブジェクト指向モデルに基づくマルチメディア文書データベース
- 学術情報センターの電子図書館システムの概要と試行実験
- 学術情報センターにおける電子図書館システムの試行
- 文献情報を対象としたスキーマ統合の一手法とシステムの構築
- マルチデータベース環境における問い合わせ処理
- 情報検索におけるスキーマの統合と質問処理
- 異種スキーマをもつデータベースへの統合的なアクセス手法
- クライアント-サーバモデルによる情報検索システムの提案
- 大型計算機センター群の共通利用番号システムの実現方式について
- 世界の電子図書館の研究動向について
- メロディからの自動インデクシングと音楽検索への応用
- 音楽検索における自動インデクシング法
- SGML文書の論理構造変換手法
- 文書の論理構造の変換におけるデータ形式の指定法
- SGML文書による全文データベースのための文法的処理を用いた論理構造の変換手法
- SGML文書本体部の論理構造の変換
- SGML文書構造の文法を用いた変換処理
- 多様な構成を持つ文書を対象とする全文データベースの処理方式
- OCR認識誤りを含む書誌情報の認識(システム分野)
- OCR認識誤りを含む書誌情報の確率的パターン解析手法
- 文書画像データからの書誌情報の抽出とマッチング
- 知的情報検索のための文献同定システム
- 検索クエリにおける修飾構造の調査(文型と意味)
- NTCIR-1 : 情報検索システム評価用テストコレクション構築の方針と実際
- 学会誌電子化の現状と将来
- 学術文献を対象とした電子図書館システムの構成法
- TSS接続による仮想画面転送(VTSS)方式
- 第57回日本図書館情報学会研究大会シンポジウム記録 : 「情報検索サービスの将来像:情報提供機関のこれからの役割と課題」
- 検索クエリを用いた情報の下位範疇化(「Webインテリジェンス」及び一般)
- B13 NLMDTDからJATSへ : NLM DTDからJATSへ(セッションB1情報システム・流通1,一般発表概要,第8回情報プロフェッショナルシンポジウム)
- Combining Page Group Structure and Content for Roughly Filtering Researchers Homepages with High Recall
- Combining Page Group Structure and Content for Roughly Filtering Researchers Homepages with High Recall
- 畳語の頻度分布調査(大規模言語資源による言語知識獲得)
- NLM DTDからJATSへ 日本語学術論文のXML編集
- 短文投稿型WebサービスからのQ&A型知識抽出に向けて (思考と言語)
- 大規模テストコレクション構築のためのプーリングについて : NTCIR-1の予備テストの分析
- ウェブページのツイート行動への関心反映度に関するブラウズ行動のコンテキストに注目した分析
- ウェブページのツイート行動への関心反映度に関するブラウズ行動のコンテキストに注目した分析
- Web視聴記録等を用いた利用者行動因子の抽出(「Webインテリジェンス」及び一般)
- Efficient Top-k Document Retrieval for Long Queries Using Term-Document Binary Matrix — Pursuit of Enhanced Informational Search on the Web —
- ミニブログ中の対話メッセージを対象としたQ&A型知識抽出
- Context Oriented Analysis of Interest Reflection of Tweeted Webpages based on Browsing Behavior (データ工学)
- 第21回年次大会予稿 ミニブログ中の対話メッセージを対象としたQ&A型知識抽出 (特集 第21回(2013年度)年次大会(研究報告会&総会))
- 短文投稿型WebサービスからのQ&A型知識抽出に向けて(言語と学習・場の供創・意味の創発)
- Web Page Classification Based on Surrounding Page Model Representing Connection Type and Directory Hierarchy
- Web Page Classification Based on Surrounding Page Model Representing Connection Type and Directory Hierarchy
- ウェブページのツイート行動への関心反映度に関するブラウズ行動のコンテキストに注目した分析(twitter・ソーシャルネットワーク,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)