近傍に基づく類似事例検索の理論的解析
スポンサーリンク
概要
- 論文の詳細を見る
近年, 事例ベース推論や例に基づく学習に代表されるように, 類似事例検索に基づく推論/学習の研究が活発に行なわれている。これらの枠組では, 現在の問題に類似した過去の事例を検索し, 検索された類似事例を直接利用することで, 問題に対する解を導出する。ここで, 解の妥当性は検索される類似事例に強く依存するため, 類似事例をどのように定義するかが大きな問題となる。最も一般的な類似事例の定義では, 類似事例の数(k)を固定し, 現在の問題に最も近いk個の過去の事例を, 問題に対する類似事例と定義する。この定義を用いた学習手法は, k-Nearest Neighbor Method(k-NN)と呼ばれている。また, 問題からの距離dを固定し, 問題からの距離がd以内の事例を類似事例と定義することも出来る。本論文では, この定義を用いた学習手法を, d-Nearest Neighborhood Method (d-NNh)と呼ぶことにする。図1は, 2次元空間において, k-NNとd-NNhが形成する, 現在の問題に対する近傍を示しており(k=5, d=0.3), 近傍内の事例が類似事例として検索され, 現在の問題に対する解の導出に利用される。本論文では, 分類問題に対するk-NNとd-NNhの平均的解析を行なう。平均的解析とは, 事例空間上の確率分布を固定することで, 目標概念に対して学習アルゴリズムが正しい答を出力する確率(正答率)を導出し, アルゴリズムの平均的な挙動を解析する理論的枠組である。我々は, 3種類のノイズ(関連属性ノイズ, 非関連属性ノイズ, クラスノイズ)が扱えるように, 平均的解析の枠組を拡張してきた。ここでは, この拡張された平均的解析の枠組を用いて, ノイズを含む問題領域におけるk-NNとd-NNhの挙動を理論的に比較する。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
関連論文
- 大規模自然言語処理学習データのための複数弱仮説を生成する弱学習器を用いる AdaBoost 手法
- 2-F-10 POS分析とアンケートに基づく大学生協の食育向上の試み(大学でのOR)
- コンフィグレーションにおけるAI技術の適用(E-コマースとAI)
- 数値属性からの例外ルール発見
- 平均的解析の拡張
- 5J-1 最小近傍法の平均的挙動の解明
- 意外性の高いルールの発見のための高速なアルゴリズム
- 分散制約充足問題の難しさに関する考察
- 重複概念の獲得が可能なクラスタリングアルゴリズムについて
- 訓練事例をガイドとする分類規則の学習
- 近傍に基づく類似事例検索の理論的解析
- 重複概念の獲得が可能なクラスタリングの一提案
- クラスタリングを用いたベイズ分類器の拡張
- K-最小近傍法におけるノイズの影響
- 線形計画法を用いた知識ベースの信頼性の評価
- EFLOP : 制約充足問題における局所最適解からの脱出法
- 階層型山登り法 : 制約充足問題の高速な解法
- サイクルを考慮した生産計画の一解法
- Simulated Annealingによる大規模生産計画問題の解法
- 仮説推論 (「計画問題と人工知能」〔第4回〕)
- 仮定に基づく組み合わせ最適化手法
- 生産計画問題におけるスケジューリング方式
- 制約充足問題における制約緩和法を用いた最適化
- スケジューリング問題における探索方式
- 企業内情報検索の高度化手法の提案と評価
- 第15回人工知能国際会議報告
- Boostingに基づく規則学習における部分候補を用いた高速化手法
- ラベルなしデータを用いた素性増強による日本語固有表現抽出方法
- カスタマーセンター支援システム
- リアルタイムSFAソリューション (特集 ユビキタス) -- (ユビキタスを支える技術)
- 信頼性(7)類似事例検索によるトラブル解決支援システム
- 事例の相対距離による類似度学習とその検索誤り率について
- ノイズを考慮した最小近傍法の理論的解析
- 距離情報による類似度関数の重み学習
- 大規模空間データからの最適領域集合の効率的な発見方法
- 類似事例検索システム : 通信ソフト故障診断問題への適用
- k-最小近傍法の平均的解析
- 最近隣法の正答率に対する理論的解析
- 重み付き最近隣法における重み学習について
- 定性的距離を用いた類似度関数の重み付けの学習
- 3.大規模半構造データからの高速な知識発見システム : 効率良い木構造バターンの発見と照合(広がる列挙の技術-列挙による問題解決アプローチ-)
- 大規模半構造データからの高速な知識発見システム : 効率良い木構造パターンの発見と照合