データ標準化を目的とした類似データの分類手法
スポンサーリンク
概要
- 論文の詳細を見る
企業の持つデータ資源を企業活動に有効活用するには、業務対応に個別に開発されてきたシステム間でのデータの流通を促進し、利用者が要求する情報を迅速に取り出せるようにすることが重要な課題となる。個々に開発されてきたシステム間では、 データの流通を阻害する原因として一般に次の問題を抱えている。(1)同じデータ項目を互いに持っていても、異なる名称であるため発見が難しい。(2)同じデータ項目であることがわかったとしても、異なる属性、異なるコード体系を持っため変換が必要である。データ流通を促進するためには、これらに該当するデータ項目を事前に検出し、標準化により名称、属性、コード体系等を統一しておくことが必要である。しかし、調査の対象とすべきデータ項目の数は1つの企業で数千〜数万に及ぶため、これを全て人手で行うには莫大な期間と工数が必要である。従って、全てのデータ項目を対象に類似のデータ項目(同一、もしくは同じコード体系とすべきデータ項目)のグループに分類するツールが望まれる。類似の名称を検索するツールは既にいくつか存在するが、従来のこの種のツールは指定の単語を含む名称を検索することを目的としており、上記の目的で用いるには効率が悪い。本稿では、データ項目をデータ項目の日本語名(以後、単に名称と記す)をもとに分類する方式を提案し、その効果を示す。
- 一般社団法人情報処理学会の論文
- 1988-09-12
著者
-
鈴木 健司
Ntt情報通信研究所
-
関根 純
(株)NTTデータ技術開発本部
-
関根 純
NTT 情報通信処理研究所
-
川下 満
NTT 情報通信処理研究所
-
鈴木 健司
NTT 情報通信処理研究所
-
川下 満
Ntt情報通信研究所
関連論文
- 分散形データベース管理システムDEIMS-3
- DB用AP開発におけるDB設計支援システムの利用法
- バイヤーの入札行動を支援する情報提供フレームワークの提案(データ解析コンペティション:オークション・データの解析)
- 1-C-6 落札価格決定モデルに基づくバイヤーへの入札支援情報提供フレームワーク(マーケティング(2))
- 高度通信網オペレ-ション標準化の推進 (次世代オペレ-ション構築の技術)
- 複合語解析技術を用いたデータ項目名称の標準化手法
- データ標準化ツール(DBprompt/NAME)における複合語解析を用いた用語辞書構築方法
- データ標準化ツール(DBprompt/NAME)を用いたデータ分析手法
- 業務情報を用いたデータベース性能診断手法
- 相補的な素性選択基準の関係を考慮した文書分類のための素性選択方式
- クリークを用いた企業間関係の構造分析
- 3. システム / サービス : 3-2 サイバー社会の玉手箱 : 電子さいふ (気の利いた情報システム)
- データベースエンジニアリングへの知識処理技術の適用 (「知識処理応用とデータベース」)
- データ項目名等の意味解析による概念モデルの作成法
- 仮想企業のためのビジネスオブジェクトモデリング
- 企業情報網のための情報流通アプリケーションアーキテクチャ
- 仮想企業モデルに基づく通信網オペレーションの一考察
- 情報流通アプリケーションアーキテクチャ
- 情報基盤のためのデータベース再構築のアプローチについて : 通信網オペレーションの高度化に向けて
- データベースプロセッサRINDAの設計と実現
- 包含関係に基づく一貫性制約記述法
- データ標準化を目的とした類似データの分類手法
- データベースプロセッサRINDAのアーキテクチャ
- インタオペラブルデータベースの実装規約 : RDAサービス
- リモートデータベースアクセス (データベースの標準化動向)
- 小特集「データベースの標準化動向」の編集にあたって
- 大規模DB向け正規化手法
- 一貫性制約を考慮したDB概念設計法
- MSIの基本ア-キテクチャ (マルチメディアサ-ビスを開発するための共通プラットフォ-ム)
- 情報検索システムにおける情報選択提供(SDI)の実現手法
- 体系的な DB 構築のための用語辞書を用いたデータ標準化手法
- DB設計を支援する情報資源辞書システムの操作機能と実現法
- DB設計支援ツールDBpromptアーキテクチャ
- DB設計用情報資源辞書システムにおける一貫性制約の記述法
- 情報検索システムに於けるインバーテッドファイルのオンライン更新実現手法
- 多様なマルチメディアサ-ビス提供のためのプラットフォ-ム構築法
- トランザクション・スクリプト記述言語STDL
- SPIRIT分散トランザクション処理仕様 (キャリア共通計算機調達仕様の開発)
- 第6回アドバンストデータベースシンポジウム
- マルチメディアデータベースのハードウェア環境 (マルチメディアデータベース)
- 電子権利流通基盤のための汎用的な原本性保証方式(21世紀のコンピュータセキュリティ技術)
- ビジネスオブジェクトのための永続オブジェクト自動生成ツール
- データベース設計品質の評価方法について
- FragmentView-マルチデータベースにおけるGlobal Viewを使わない異種性解消方式 (時空間データベースおよび一般)
- 既存システム分析による情報整備手法
- 多様な要求条件に対応可能なマルチメディアサービス向けサービスオーダ管理アーキテクチャの提案
- ユーザビューを意識したデータ分析の一考察
- システムのライフサイクルに適応したDB設計情報管理方式
- MSIのテレエデュケ-ションサ-ビスへの適用方式 (マルチメディアサ-ビスを開発するための共通プラットフォ-ム)
- デ-タベ-スプロセッサの動向 (デ-タベ-スプロセッサ)
- 業務要件に基づくビジネスオブジェクトカスタマイズツール
- 大規模DBのためのデ-タ標準化手法 (デ-タベ-ス処理技術の研究)
- 大規模DBシステム向けのDB設計手法 (デ-タベ-ス処理技術の研究)