大規模データに対する情報損失の少ないk-匿名化手法(匿名化・回帰分析・問合せ,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
医療データなどの個人情報はデータ解析を行う上で非常に役に立つ.ところが,個人情報はプライバシー保護の観点から簡単に公開することはできない.そこで,データの匿名化が必要になる.一般的な匿名化手法の一つにk-匿名化がある.k-匿名化とは,どの個人に対しても,データの中でその個人に対応しうる項目がん個以上存在するように,データの一部を加工・削除することである.その際,元のデータをより多く残した上での匿名性の達成が望まれる.k-匿名化に関する先行研究は多く存在するが,大規模データのk-匿名化に対する研究はあまり存在しない.本研究では大規模なデータベースに対して現実的な時間でより既存手法より精度の高い匿名化を行うアルゴリズムを提案する.数値実験により,本提案手法が従来研究の手法より元のデータを多く残した上で匿名化を行うことおよび,本提案手法が大規模なデータテーブルに対しても実用的な時間内に匿名化を完了することを確認した.
- 一般社団法人電子情報通信学会の論文
- 2013-07-15
著者
関連論文
- 弦グラフおよび弦二部グラフのクラスにおけるマッチングの数え上げ
- 木の均一分割問題
- 最短路高速検索のための階層メッシュ疎化法
- 2-E-5 最短路高速検索のための階層メッシュ疎化法(組合せ最適化と応用(3))
- Enumeration of Perfect Sequences of Chordal Graph (Acceleration and Visualization of Computation for Enumeration Problems)
- 2-E-17 Enumeration of Perfect Sequences of Chordal Graph
- コーダルグラフの完全列の列挙
- 距離遺伝的グラフの木表現とその応用
- コーダルグラフの独立点集合の数えあげ問題
- 木構造の動的ネットワーク上の施設配置問題に対するO(nlog^2n)時間アルゴリズム
- 負の重みに対応した高速頻出集合発見プログラムの開発(人工知能,データマイニング)
- 1-E-4 Web版訪問介護スケジュール作成支援システム(スケジューリング)
- グラフクラスと部分グラフ同型性
- 計算幾何学的な手法を用いた高速相同性計算手法
- 支配集合数え上げ問題とグラフクラス
- 電力取り引きにおける約定量決定問題の高速解法
- 電力取り引きにおける約定量決定問題の高速解法(組合せ最適化(5))
- パターンマイニングの新しい落としどころ : クラスタリングを用いたパターンマイニング(コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- パターンマイニングの新しい落としどころ : クラスタリングを用いたパターンマイニング(コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ディジタルハーフトーニングへの応用に向けての魔方陣の一般化(2)
- ディジタルハーフトーニングへの応用に向けての魔方陣の一般化(1)
- ディジタルハーフトーニングへの応用に向けての魔方陣の一般化(2)
- ディジタルハーフトーニングへの応用に向けての魔方陣の一般化(1)
- 極小出現区間を用いたエピソードマイニングの高速化(データベース・アルゴリズム)
- 極小出現区間を用いたエピソードマイニングの高速化(データベース・アルゴリズム)
- データインテンシブコンピューティング : その2 頻出アイテム集合発見アルゴリズム(知能コンピューティングとその周辺〔第2回〕)
- ワイルドカードを許した極大モチーフの列挙アルゴリズム
- 大規模木構造データからの頻出無順序木パターン発見アルゴリズム (計算機科学基礎理論の新展開)
- 大規模木構造データからの頻出部分構造パターン発見アルゴリズム(文字列アルゴリズム)
- 半構造データからの効率よい無順序木パターン発見手法(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- 半構造データからの効率よい無順序木パターン発見手法(インターネット環境でのデータ工学とディペンダビィリティ及び一般)
- 半構造データからの効率よい無順序木パターン発見手法
- 大規模木構造データからの高速な部分構造発見(「21世紀の知識情報科学に向けて」,及び一般)
- 2部クリークを用いたclosed item setの効率的な列挙(「21世紀の知識情報科学に向けて」,及び一般)
- 双対化を用いた新しい極大頻出アイテム集合の計算(「21世紀の知識情報科学に向けて」,及び一般)
- 中小規模スタッフスケジューリング問題における調整の容易なスケジュール作成に関する研究
- 色付き木の列挙
- コーダルサンドイッチの列挙, ランダム生成, 数え上げについて (理論計算機科学の深化 : 新たな計算世界観を求めて)
- 2-F-5 多目的最適化への列挙アルゴリズム理論からのアプローチ(数理計画(1))
- 無順序根無し木を列挙するシンプルなアルゴリズム
- 無順序木を列挙するシンプルなアルゴリズム
- 平面三角分割グラフを列挙するアルゴリズムの改良
- UNO は一人でも難しい (計算機科学とアルゴリズムの数理的基礎とその応用)
- 擬似クリークを列挙する多項式時間遅延アルゴリズム
- RF-006 負の重みに対応した高速頻出集合発見プログラムの開発(人工知能・ゲーム,査読付き論文)
- Genome Homology Visualization by Short Similar Substring Enumeration (Acceleration and Visualization of Computation for Enumeration Problems)
- 2-E-18 ハミング距離の短い文字列ペア列挙アルゴリズムと解析ツール(組合せ論)
- 1-A-4 修正を前提としたExcelベースのスタッフスケジューリングツールの開発(つくばOR学生発表(5))
- スタッフスケジューリングにおける修正しやすさを考慮した解の分析 (21世紀の数理計画 : 最適化モデルとアルゴリズム)
- 1-B-8 スタッフスケジューリングにおける修正しやすさを知る為の実験とその考察(スケジューリング(2))
- 1-B-9 部品の取り外しを考慮した仕掛り在庫と受注の高速マッチング(スケジューリング(2))
- 木構造動的ネットワークにおける複数個の施設配置問題(組合せ最適化(5))
- RA-003 修正作業を効果的に支援するExcelベースのスタッフスケジューリングツールの開発(モデル・アルゴリズム・プログラミング,査読付き論文)
- ゲノム情報学における高速データ処理
- 列挙アルゴリズム(新・ORの図解,学会創立50周年記念号)
- 列挙を用いたモデリングの進展(モデリング-さまざまな分野,さまざまな視点から-)
- 近年の列挙技術の進展 : 計画立案と解法(ここまで使える数理計画法)
- DS-1-16 弦グラフおよびその部分クラスの列挙(DS-1.COMP-NHC学生シンポジウム,シンポジウム)
- 頻出パターンの高速列挙
- 飽和系列パターンの多項式時間列挙アルゴリズム
- 飽和系列パターンの多項式時間列挙アルゴリズム
- 高速クリーク・密部分グラフマイニングアルゴリズム(離散構造処理系-知能情報処理を支えるアルゴリズムの技法)
- D-1-6 マッチングアルゴリズムを用いた匿名化手法の提案(D-1.コンピュテーション,一般セッション)
- 最適化から見たデータマイニング(活躍する機械学習)
- DS-1-5 ひとりにしてくれ数(DS-1.COMP学生シンポジウム,シンポジウムセッション)
- 高速クリーク・密部分グラフマイニングアルゴリズム
- 最適化から見たデータマイニング
- 最小完全ハッシュ関数を用いたグリッドグラフ上の効率的なパス数え上げ
- 超辺の縮約を許した非巡回部分超グラフの効率よい列挙
- 木に含まれる限定サイズ部分木の列挙
- 運用コストを重視した最適化 : 小規模な事業所で運用可能なシステムを考える(論文・研究レポート)
- 隣の芝は青くない
- 基単調図形に分割可能な最大重み領域を得る基線の配置問題
- 長さ極大な群れパターンを軌跡集合から効率良く発見するアルゴリズム
- 大規模データに対する情報損失の少ないk-匿名化手法
- 大規模データに対する情報損失の少ないk-匿名化手法
- 単位正方形上の一意被覆問題に対する近似アルゴリズム
- 2-A-7 運用コストを重視したORに向けて(特別セッション スモールビジネスOR(1))
- マイクロクラスタリングを用いた単語分類とトピック検知
- 1-B-2 最適匿名化手法(離散最適化(1))
- 魅力的な研究提案を目指して
- DS-1-11 Free Flood Filling Gameの計算複雑性について(DS-1.COMP学生シンポジウム,シンポジウムセッション)
- K-縮退グラフに含まれる誘導木の列挙
- 長さ極大な群れパターンを軌跡集合から効率良く発見するアルゴリズム(一般)
- 大規模データに対する情報損失の少ないk-匿名化手法(匿名化・回帰分析・問合せ,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
- いや,実のところはねぇ(異分野コミュニケーションによる最適化の広がり)
- 木に含まれる限定サイズ部分木の列挙
- 基単調図形に分割可能な最大重み領域を得る基線の配置問題