データマイニングにおける新しい欠損値補完方法の提案(パターン認識)
スポンサーリンク
概要
- 論文の詳細を見る
本論文は, データに含まれる欠損値の対処に際し, 有力な補完方法を提案するものである.この提案する補完方法は, 実際のデータを用いた数値実験から, いくつかの既存法よりも, 判定精度, 平均対数ゆう度の二つの観点から最も優れた対処法であることが確認された.理論的な背景は, この補完法が, 欠損ではないデータの内部的な構造に依存せずに処置を施すためである.これによって, 学習用データに対するオーバフィットを回避し, 結果として実証用データに対しても判定精度の高いモデルを構築することが可能となった.本論文の構成は, まず, 削除法, 平均値補完法, k-NN法, 重み付きk-NN法, の既存4手法と, 提案する新しい手法の概要を紹介する.次に欠損値をもたない実際の医療データに対し, 様々な割合で任意の位置に故意に欠損を発生させ, 先に紹介した5手法によりデータを整備する.そしてこれらのデータに基づいてモデルを構築し, 判定精度, 平均対数ゆう度の二つの観点から5手法の有効性を判定する.最後に, これらの結果が得られた理論背景について各手法の特性を比較しながら検討するという内容となっている.
- 社団法人電子情報通信学会の論文
- 2005-04-01
著者
関連論文
- B/Sを利用した回収率とそれに基づく貸出債権の適正プライシング・モデル(実用,数理ファイナンス,平成18年研究部会連合発表会)
- 2-E-1 企業財務データを用いた回収率モデルに関する研究(金融(3))
- データマイニングにおける新しい欠損値補完方法の提案(パターン認識)