事例間の局所的な関係と分類の大域的な概観からの直観的クラスタリングの誘導
スポンサーリンク
概要
- 論文の詳細を見る
事例からの概念記述の誘尊は、機械学習の領域で研究されてきた。多くの概念帰納学習の研究では、事例や概念の記述に述語論理が用いられている。概念クラスタリングのプログラムであるCLUSTER/Sでは、構造的記述を取り扱えるように、述語論理が拡張されている。ID3という帰納アルゴリズムでは、概念は、決定木として記述される。ひとつのは、節が属性に対応し、枝が属性値に対応するような決定木における、ひとつの葉に割り当てられる。属性に基づく表現言語は、事例を特徴付ける記述が首尾一貫していること、および、カテゴリーを特徴付ける概念が事例の一般化であることを前提にしている。一方、文芸評論家が、ある作家の全作品を「重い」作品と「軽い」作品に分類するというような状況では、事例や概念の記述に、述語論理や決定木を用いることは困難である。彼は、ある作品が他の作品と似ているということを直観的に判断できるし、「重い」「軽い」という言葉の意味を直観的に理解できる。それにもかかわらず、ある作品が「重い」か「軽い」かを、機械的に決定することは難しい。なぜならば、各作品を特徴付ける屈性や、「重い」「軽い」というカテゴリーの一般的な記述が、明白ではないからである。たまたま見い出された属性も、すべての作品を首尾一貫して説明できないかもしれないし、目標とするカテゴリーに関係しているとはかぎらない。このような状況は直観的分類の枠組を必要とする。事例を特徴付ける記述が、互いに矛盾していたりカテゴリーを特徴付ける概念が、その概念に属する事例と矛盾していたりすることを許容する枠組を考えなければならない。本論文で提示する直観的分類の基本メカニズムでは分類の大域的な概観が、事例間の局所的な関係の統一性の欠如を埋め合わせる。しばしば普通の辞書の代わりに用いられるシソーラスからの類推によって、ある事例はその事例と類義的または反義的な事例の集合として、直観的に記述されると仮定する。局所的な類義性/反義性のような関係を取り扱うことは、理にかなっている。これは、ふたつの事例が類義的であるか反義的であるかを、直観的に判断することができるからである。しかし、他の多くの種類の関係を取り扱うことは、理にかなっていない。これは、それらの間の区別が離しくなるからである。完全なシソーラスは、完全な語の定義から導かれ、完全な語の分類は完全なシソーラスから導かれる。逆に言えば、事例間の局所的な関係から、有意義なクラスタリングが得らぇるとはかぎらない。このような場合には、分類の意図を与えることによって、有意義なクラスタリングが得られる。分類の意図は典型的な事例を含み、カテゴリーを倍黙的に定義するクラスターの集合として、直観的に与えられると仮定する。このようなクラスターの集合は、望ましいクラスタリングの大域的な概観を間接的に示している。ここで、あるカテゴリーは、それに属するための必要十分条件の集合として定義されない。カテゴリーは典型的な事例と非典型的な事例を含んでいる。本論文で提示する直観的分類の枠組では事例のクラスタリングは得られるが分類規則は生成されない。学習システムが分類規則を生成することは、理にかなっている。しかし直観的な情報を取り扱う問題では、分類規則を得ることは困難である。すべての事例が適切に分類されているならば、事例のクラスタリングは、問題解決のために、必須であり、かつ、有用である。
- 一般社団法人情報処理学会の論文
- 1992-02-24
著者
関連論文
- 遺伝的アルゴリズムによるソフトウェア開発計画の立案
- 事例間の局所的な関係と分類の大域的な概観からの直観的クラスタリングの誘導
- 部分的関係からのクラスタリング : 直観的データ解析の枠組
- アニーリング法による最適な型付きλ式の導出
- 経営情報システムの分析のためのドメインモデル
- 企業組織内の現象のモデルに基づく要求獲得
- オブジェクト指向モデルを用いた業務分析に基づく要求獲得の試み
- オブジェクト・モデルに基づく要求獲得支援ツール
- 企業情報システムの要求分析のためのドメインモデル
- オブジェクト指向モデルを用いた要求獲得の支援