機械学習とtf-idf法を用いたスパムメール分類における重要単語選択パラメータの振る舞い
スポンサーリンク
概要
- 論文の詳細を見る
機械学習を用いたメールフィルターシステムの開発において、スパムメールの分類に必要な単語の抽出にtf-idf法を導入した方法を提案する。tf-idf値によって全ての出現単語を降順に並べ、その上位部分の個数と全単語数の割合をパラメータとして設定した。この上位部分を重要単語として提案手法で実験したところ、このパラメータに依存してスパムメールの分類性能が変化することが分かった。そして、学習メールを効率よく分類するためには、適切なパラメータの設定が重要であることが分かった。
- 一般社団法人電子情報通信学会の論文
- 2013-02-27
著者
-
杉井 学
山口大学大学情報機構メディア基盤センター
-
松野 浩嗣
山口大学大学院理工学研究科自然科学基盤系専攻
-
松野 浩嗣
山口大学大学院 理工学研究科
-
橋村 有紀
山口大学理学部
-
石崎 慎太郎
山口大学理学部
関連論文
- 確率を用いたトークン滞留しない時間ペトリネットモデルのトランジション発火時間の決定法
- Cancel CTSのIEEE802.11DCFへの実装と性能評価(セッション1 : 無線ネットワーク)
- 隠れ端末の送信を抑制する衝突回避型ブロードキャストプロトコル(セッション1 : 無線ネットワーク)
- Cancel CTSのIEEE802.11DCFへの実装と性能評価(セッション1:無線ネットワーク)
- 隠れ端末の送信を抑制する衝突回避型ブロードキャストプロトコル(セッション1:無線ネットワーク)
- B-5-142 隠れ端末を抑制する信頼性の高いブロードキャストプロトコル(B-5.無線通信システムB(ワイヤレスアクセス),一般講演)
- リカレントニューラルネットワークによる細胞内反応経路の脆弱・頑健部位の推定手法(バイオサイバネティックス,ニューロコンピューティング)
- D-2-14 細胞内反応経路の脆弱部位推定に関する一考察(D-2. ニューロコンピューティング,一般セッション)
- 4G-3 eラーニングによる内視鏡教育のためのバーチャル診断システムの試作(eラーニング(2),一般セッション,コンピュータと人間社会)
- 避難所実態調査と地震被害想定からの防災課題--山口県柳井市の事例 (地震防災分野--震害と防災特集)
- シグナル伝達経路のペトリネット表現に基づく反応パラメータ条件式導出アルゴリズムの提案(システムバイオロジー,システムバイオロジー,一般)
- 隠れ端末の危険度に基づいた衝突回避制御を行うブロードキャストプロトコル
- 自律的無線ネットワークを用いた被災情報提供システム-被災地域の地形を考慮した無線ノード置局アルゴリズムの提案
- 機械学習によるタンパク質N-ミリストイル化規則の予測(Sequence & structure analysis)
- 普及型無線LAN回線を使用するリアルタイムデータ伝送システムの開発(セッション1:無線ネットワーク)
- 普及型無線LAN回線を使用するリアルタイムデータ伝送システムの開発(セッション1:無線ネットワーク)
- 普及型無線LAN回線を使用するリアルタイムデータ伝送システムの開発(セッション1:無線ネットワーク)
- Cancel CTSのIEEE802.11DCFへの実装と性能評価(セッション1 : 無線ネットワーク)
- 隠れ端末の送信を抑制する衝突回避型ブロードキャストプロトコル(セッション1 : 無線ネットワーク)
- B-5-141 Cancel CTSを実装したIEEE802.11DCFの提案と性能評価(B-5.無線通信システムB(ワイヤレスアクセス),一般講演)
- 送信影響範囲を基準としたMACプロトコルの効率化とその評価(セッション1 : 無線プロトコル)
- IEEE802.11DCFにおける端末間の送信機会公平化に関する研究(セッション1 : 無線プロトコル)
- 木構造と文字列類似度に基づく言語の同一性判定
- シミュレーションによる細胞内未同定分子作用の予測
- 確率を用いたトークン滞留しない時間ペトリネットモデルのトランジション発火時間の決定法
- AT-3-4 コンカレント工学に基づく細胞システムのモデル化とシミュレーション(AT-3. コンカレント工学の理論と応用,チュートリアルセッション,ソサイエティ企画)
- 船間無線LANを用いた小型船舶対象の安心ネットワーク(所外発表論文等概要)
- IEEE802.11DCF端末との混在環境下におけるMAC Level Fairness向上方式の提案
- 船間無線LANを用いた小型船舶対象の安心ネットワーク構築
- 自律的無線ネットワークを用いた被災情報提供システム-被災地域の地形を考慮した無線ノード置局アルゴリズムの提案-
- 自律的無線ネットワークを用いた被災情報提供システム-被災地域の地形を考慮した無線ノード置局アルゴリズムの提案-
- 自律的無線ネットワークを用いた被災情報提供システム-被災地域の地形を考慮した無線ノード置局アルゴリズムの提案-
- 情報セキュリティ教育のためのeラーニング教材の開発について(情報教育研究)
- 機械学習によるスパムメールの特徴の決定木表現(セッション4-B : セキュリティ応用技術)
- 機械学習によるスパムメールの特徴の決定木表現(セッション4-B : セキュリティ応用技術)
- キャリアセンスと時分割による無線LANアクセス方式の提案と評価
- キャリアセンスと時分割による無線LANアクセス方式の提案と評価
- キャリアセンスと時分割による無線LANアクセス方式の提案と評価
- 木構造と文字列類似度に基づく言語の同一性判定
- ライフタイムに着目したモバイルエージェントの性能特性とその評価
- シグナル伝達経路ペトリネットモデルにおける遅延時間の整合性確認手法の提案(一般,コンカレントシステム及び一般)
- Ethnologue 15th言語属性データと言語系統データの生成および言語同定における利用
- 語順地図作成に必要なデータ及び語順地図に現れる語順分布
- 生命パスウェイの脆弱部位推定の一考察
- サイクリック構造を含むシグナル伝達経路ペトリネットモデルの滞留なし発火頻度決定手法の提案 (回路とシステム)
- サイクリック構造を含むシグナル伝達経路ペトリネットモデルの滞留なし発火頻度決定手法の提案 (システム数理と応用)
- ベイズフィルタと決定木分類による併用メールフィルタの判定方式の改善と効果 (システム数理と応用)
- SOMによる蛋白質情報を用いた癌細胞の分類手法
- シグナル伝達経路の性質に基づく時間ペトリネットのトークン滞留なし条件の検討 (システム数理と応用)
- D-19-1 災害時に避難者の安否を管理するためのRFIDシステムの開発(D-19.情報通信システムセキュリティ,一般セッション)
- 災害情報と被災情報を共有する自律的な無線ネットワークシステムの構築(RFID関連技術,システムオンシリコン,一般)
- D-16-4 可視化数列に基づくクラスター分析によるがん細胞の分類(D-16.医用画像,一般セッション)
- サイクリック構造を含むシグナル伝達経路ペトリネットモデルの滞留なし発火頻度決定手法の提案(グラフ,ペトリネット,ニューラルネット,及び一般)
- サイクリック構造を含むシグナル伝達経路ペトリネットモデルの滞留なし発火頻度決定手法の提案(グラフ,ペトリネット,ニューラルネット,及び一般)
- D-16-1 タンパク質分布情報によるがん細胞の可視化手法に関する一考察(D-16.医用画像,一般セッション)
- D-2-11 可視化数列によるがん細胞認識に関する一考察(D-2.ニューロコンピューティング,一般セッション)
- 端末間の隣接情報を考慮した最大クリーク抽出アルゴリズムによるスロット化CSMAの提案
- D-2-13 SOMによるがん細胞の分類に関する一考察(D-2.ニューロコンピューティング,一般セッション)
- ベイジアン方式と機械学習の併用によるスパムメールフィルタリング
- ベイズフィルタと決定木分類による併用メールフィルタの判定方式の改善と効果
- シグナル伝達経路の性質に基づく時間ペトリネットのトークン滞留なし条件の検討
- サイクリック構造を含むシグナル伝達経路ペトリネットモデルの滞留なし発火頻度決定手法の提案
- サイクリック構造を含むシグナル伝達経路ペトリネットモデルの滞留なし発火頻度決定手法の提案
- 災害情報と被災情報を共有する自律的な無線ネットワークシステムの構築
- セルアレイデータに基づくがん細胞分類を支援するタンパク質情報可視化手法の提案(システムと信号処理及び一般)
- セルアレイデータに基づくがん細胞分類を支援するタンパク質情報可視化手法の提案(システムと信号処理及び一般)
- セルアレイデータに基づくがん細胞分類を支援するタンパク質情報可視化手法の提案(システムと信号処理及び一般)
- セルアレイデータに基づくがん細胞分類を支援するタンパク質情報可視化手法の提案(システムと信号処理及び一般)
- 論理的モデリング手法によるDelta-Notchシグナル伝達経路の再解析
- 機械学習とtf-idf法を用いたスパムメール分類における重要単語選択パラメータの振る舞い
- 被災情報共有無線ネットワークの平常時利用: 適応的観光ルート推薦手法の提案と有用性確認実験(ソフトコンピューティング,一般)
- 機械学習とtf-idf法を用いたスパムメール分類における重要単語選択パラメータの振る舞い
- 滞留なしペトリネットにおける依存部分ネット決定アルゴリズムの提案
- 論理的モデリング手法によるDelta-Notchシグナル伝達経路の再解析
- 地域コミュニティ活動と連携した被災情報提供システムの開発(社会・応用システム,モバイルアプリケーション,ユビキタスサービス,モバイル分散クラウド,モバイルアドホックネットワーク,センサネットワーク,モバイルネットワーク及び一般)
- シグナル伝達経路の性質に基づく時間ペトリネットのトークン滞留なし条件の検討
- ベイズフィルタと決定木分類による併用メールフィルタの判定方式の改善と効果
- セルアレイデータに基づくがん細胞分類を支援するタンパク質情報可視化手法の提案
- セルアレイデータに基づくがん細胞分類を支援するタンパク質情報可視化手法の提案
- セルアレイデータに基づくがん細胞分類を支援するタンパク質情報可視化手法の提案