レコード同定問題に関する研究の課題と現状(<特集>データ工学論文)

スポンサーリンク

概要

論文の詳細を見る
単一あるいは異なる情報源の間で重複するレコードを見つけ出す「レコード同定」は, データベースの品質管理やデータ統合に必須の技術である.しかしながら, このレコード間の照合は一般に容易には実現できない.というのも多くの場合, レコード同士は統一的な識別子をもたず, レコードの属性や値の間にも厳密な対応関係が存在しないためである.特に, 長期間にわたり分散化した環境のもとで構築された大規模なデータベースにおいて, 信頼性高くレコードを同定することはコストのかかる困難な作業となる.そこで本論文では, 重複レコードを検出するためのレコード同定手法に注目し, 研究動向を概観する.
社団法人電子情報通信学会の論文
2005-03-01

著者

関連論文

もっと見る

スポンサーリンク