2変量正規乱数データによるIP-OLDFの評価
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 整数計画法(IP)を用いて, 標本誤分類数(率)を最小化する最適線形判別関数(IP-OLDF)を導出し, さらに, この定式化を少し変えることで, 誤分類されたケースの判別境界点からの距離の和を最小化するLP線形判別法を開発した.誤分類数を最小化する基準は, これまでの確率分布を前提に多くの成果を得てきた統計理論になじまない危惧がある.しかし, 本手法では, 誤分類数が標本に対し一意に決まり, 打ち切り基準を用いない変数増加法(上昇基本系列という事にする)で誤分類数は単調減少するという優れた特徴をもっている.さらに, 本手法は正規分布のような特定の分布を仮定していないので, 多くのダーティな現実データの判別に適していると期待できる.これまで, フィッシャーのアイリスデータと医学データを用いて, これらをFisherの線形判別関数(線形判別関数)と2次判別関数とで比較評価を行った.今回は, 標準サイズ100の2変数の正規乱数データを4組作成した.うち2組を内部標本(G1, G2)とし, 残り2組をそれらに対応する外部標本(G3, G4)とした.さらに, G1とG3群を0度, 30度, 45度, 60度, 90度回転させ, G2群とG4群は23組の整数値をこの2変数に加え平行移動した.この回転と平行移動の組み合わせで得られる115組(=5×23)の内部標本(G1, G2)に対して, IP-OLDF, LP線形判別関数, 線形判別関数と2次判別関数を求め, 得られた判別式を外部標本(G3, G4)に適用しExternal Checkを行った.これらの結果を, 誤分類数としてまとめ, 平均値の差の検定と回帰分析で各種判別手法の比較評価を行った.誤分類数の平均値の大小順は, 内部標本ではIP-OLDF, 2次判別関数, 線形判別関数, LP線形判別関数の順に大きくなった.外部標本では, 2次判別関数, IP-OLDF, 線形判別関数, LP線形判別関数の順になった.平均値の差の検定から, 外部標本のIP-OLDFと線形判別関数のみ差がないことが分かった.相関係数は, いずれも0.967以上と高かった.医学データと異なり2次判別関数による誤分類数も, IP-OLDFで良く回帰できた.また各判別手法の誤分類数をIP-OLDFで回帰した回帰直線を比較しても, 差の検定と同じ結果になった.層別箱ひげ図で検討すると, 回転の影響より, 平行移動の影響が強いことが分かった.以上から, IP-OLDFは現実のデータでも乱数データでも, 従来の判別関数に劣らない結果を得た.LP線形判別関数は, 計算時間が少ないことから, IP-OLDFを補完するものと期待したが, 判別関数として利用するには不適切である事が分かった.
- 日本計算機統計学会の論文
- 2000-10-31
著者
関連論文
- 線形計画法による改定IP-OLDFの計算時間の改善
- 拡張主成分の性能の評価
- C-6 オンライン変数選択プログラムVASMM
- オンライン変数選択プログラムVASMM
- 表計算ソフト上の統計処理 (日本計算機統計学会第7回大会報告)
- インターネットを介した統計パネル討論の試行 : 第1回オンラインパネルディスカッション : 統計教育はこれでいいのか〜!?
- 因子分析における変数選択規準の考察(一般講演)
- 拡張主成分分析の評価について
- 特定のアイテムを含んだアソシエーションルールの抽出(一般講演II,日本計算機統計学会第18回シンポジウム)
- 特定のアイテムを含んだアソシエーションルールの抽出(一般講演II)
- 判別分析におけるアプリオリアルゴリズムを利用した変数選択手法の改良
- XMLグラフィックスの統計環境における活用(SGセッション2, 日本計算機統計学会第18回大会報告)
- XMLグラフィックスの統計環境における活用(SGセッション2)
- 丸山ワクチン15万症例のデータマイニング
- OLDFとSVMの比較研究(4)-種々のデータによるSVMとの比較-
- 改定IP-OLDFによるIP-OLDFの問題点の解消
- FLASHを利用した統計教育コンテンツの開発(一般講演IV,日本計算機統計学会第18回シンポジウム)
- 統計教育マルチメディア教材の開発(セッション5, 日本計算機統計学会第18回大会報告)
- 密度推定におけるバンド幅の選択-Least Squares Cross Validation-法について(セッション4, 日本計算機統計学会第18回大会報告)
- 統計教育用教材の開発(日本計算機統計学会 第19回大会)
- FLASHを利用した統計教育コンテンツの開発(一般講演IV)
- 統計教育のためのWeb教材(第17回日本計算機統計学会大会報告)(セッション1)
- 統計教育マルチメディア教材の開発(セッション5)
- 密度推定におけるバンド幅の選択 : Least Squares Cross Validation法について(セッション4)
- D-5 統計教育のためのWeb教材(企画セッション:ネットベースの統計環境の利用と応用)(2003年度統計関連学会連合大会記録(日本統計学会第71回大会))
- Webを利用した統計教育コンテンツの開発
- Webを活用した統計教育教材の開発
- 統計教育のための Web 教材
- 統計教育のための Web 教材
- シミュレーションを活用した統計学教育教材とその利用
- 数理計画法による判別分析の10年
- 5A-2 地理統計データの異方性の修正について(セッション5A)
- GoogleMapsを用いた地理統計データの可視化 (特集 統計データの可視化)
- 地理統計データのバリオグラム推定におけるカットオフの選択とその検証(一般セッションIV)
- 地理統計解析システムにおけるSVGの利用について(セッション5, 日本計算機統計学会第18回大会報告)
- バリオグラム推定におけるカットオフの選択について(日本計算機統計学会 第19回大会)
- 空間データのモデル選択について(第17回日本計算機統計学会大会報告)(セッション4)
- 地理統計解析システムにおけるSVGの利用について(セッション5)
- 空間データのモデル選択について
- 密度推定におけるカーネル関数とバンド幅について
- 10周年記念CD-ROM作成顛末記
- 計算機統計学会の過去と未来(会長就任にあたって)
- 日本計算機統計学会第15回大会報告
- 2変量正規乱数データによるIP-OLDFの評価
- 乱数データを用いた最適判別関数の評価(日本計算機統計学会・第12回シンポジウム報告)
- 統計ソフトウェア 小地域データにおける地理統計解析とSVGによる可視化 (特集 統計データの可視化)
- C-7 乱数データを用いた最適線形判別関数の評価(日本統計学会第67回大会記録 : 離散データの解析(2))
- 乱数データを用いた最適線形判別関数(IP-OLDF)の評価
- 乱数データを用いた最適判別関数の評価 (1)
- 統計ソフトウェアの発展(日本計算機統計学会 第19回シンポジウム)
- 日本における統計ソフトの開発を振り返って
- Windows版統計解析ハンドブック ノンパラメトリック法
- 多変量解析における不完全データの影響
- G9-4 欠損値を含むデータの多変量解析における感度分析
- 欠損値に構造のあるデータの多変量解析(2) : 正規分布の場合のパラメータ推定について
- 欠損値に構造のあるデータの多変量解析
- 統計解析ハンドブックfor Winソフトウェアの紹介 (デモンストレーション)
- ニューラルネットワークを用いたデータ圧縮
- データ編集ユーティリティ De for Win
- 感度分析プログラムSAMMIF
- 7-6 シミュレーションを活用した統計学教育教材の研究(7数量関係,幼稚園・小学校,日本数学教育学会第86回総会全国算数・数学教育研究(鹿児島)大会)
- G9-6 欠損値処理プログラム「iStat」について(一般セッション(G9) : CIM (Computer Intensive Methods))(第30回日本行動計量学会大会発表一覧)
- 分割表における秘匿セルの簡易補完法及び,そのオンラインシステムへの実装について
- PRAMの理論とその実用上の諸問題 (特集 個票開示問題の統計理論)
- C-2 統計調査データのオンラインでの有効利用
- 統計調査データのオンラインでの有効利用
- 欠損値処理プログラム「iStat」について(CIM (Computer Intensive Methods))
- アンケート調査データの収集と分析 : 岡山行動圏調査について
- PRAMを適用したマイクロデータの分割表推定
- A′-2 データの秘匿が分析におよぼす影響について(日本統計学会第68回大会記録 : 我が国におけるマイクロデータ提供の展望 (2))
- データの秘匿が分析におよぼす影響について
- Web上の統計解析システムの構築 : CGIによる統計処理とグラフ描画の実装
- 入試入れ替わり率解析システム : SRAS
- 合否入れ替わり率解析ソフトウェアについて
- Webを利用した統計解析
- OLDFとSVMの比較研究(10)-k重交差検証法による新しい変数選択法-
- 数学でできる問題解決学
- OLDFとSVMの比較研究(9)2万件リサンプリングデータによる10重交差検証法
- OLDFとSVMの比較研究(8)改定IP-OLDFのリサンプリングデータによる評価
- OLDFとSVMの比較研究(7)IP-OLDFによる線形判別関数の新しいモデル選択法の提案
- OLDFとSVMの比較研究(6)LINGOによる改定IP-OLDFと改定IPLP-OLDFの比較
- OLDFとSVMの比較研究(5)-高速な組み合わせ最適化アルゴリズムの提案-
- SVMの高速な新アルゴリズムの提案
- OLDFとSVMの比較研究(3)SVMのアルゴリズムの秘密
- OLDFとSVMの比較研究(3)SVMのアルゴリズムの秘密
- SVMのアルゴリズムの秘密(一般セッションV)
- 改定IP-OLDFによる2万件データのExternal Check(一般セッション1)
- OLDFとSVMの比較研究(2)改定IP-OLDFと改定LP-OLDFの提案
- OLDFとSVMの比較研究(2)改定IP-OLDFと改定LP-OLDFの提案
- OLDFとSVMの比較研究(1)-スイス銀行紙幣データと同じ構造をもつ2万件の正規乱数データによる検証-
- IP-OLDFの判別分析への新しい貢献(日本計算機統計学会 第19回大会)
- 数理計画法を用いた最適線形判別関数(10)-多重共線性の解消とIP-OLDFの評価-
- 組み合わせ判別分析の提案 : 1000スイスフラン偽札紙幣の分析(一般講演IV)
- 数理計画法を用いた最適線形判別関数(9) : 1000スイスフラン偽札紙幣の分析
- 合否判定データによる判別分析の問題点
- 1B-1 LINGOによる改定IP-OLDFと改定IPLP-OLDFの比較(セッション1B)
- データ解析システム DASID
- データ辞書を利用したデータ解析システムの開発
- 最適線形判別関数による実証研究(特別セッション 判別分析の新潮流(2))
- 最適線形判別関数の理論(特別セッション 判別分析の新潮流(2))