構造と特徴選択に着目した電子メールの分類手法の提案 : FromフィールドとJeffreys Perksを用いたナイーブベイズ分類(重要語抽出・検索・文書分類)
スポンサーリンク
概要
- 論文の詳細を見る
本研究は、E-mailをあらかじめユーザが設定したフォルダに自動分類するE-mailフィルタリング手法について提案と比較検討を行った。著者はナイーブベイズに基づいたE-mailのフィルタリングの検討に加え、E-mailの構造の特徴であるフィールドの違いに着目する手法を提案する。多くの研究でもE-mailを従来のテキストフィルタリングの手法を用いて行ってきたが、E-mailは新聞やWebなど従来のテキストフィルタリングで扱われてきたテキストと異なり、(1)一テキストファイルに含まれる単語の数が少ないこと、(2)ファイル内にフィールドの構造を持つといった特徴がある。これらの特徴を考慮し、著者はナイーブベイズに基づいたテキストフィルタリングをE-mailのフィルタリングのために最適化を実現する手法を提案する。その中で、我々はE-mailのフィールド、単語の出現頻度の推定にJeffreys Perks、単語に対してDF(Document Frequency)で重みを付けてその値で特徴選択を行うことを提案した。データとしてENRON CORPUSを用い、フィールドと単語の重み付けの違いの比較実験を行い、提案手法の有効性を確認した。
- 2005-07-15
著者
関連論文
- 情報・知識共有を支援する協調フィルタリングに関する研究 : 協調フィルタリングの適用箇所拡大にむけた方法の提案(PRMU一般セッション(2))(認識と学習,模倣学習)
- 協調フィルタリングにおけるユーザの選択及び嗜好抽出の手法の提案(セッション7A : フィルタリング)
- 協調フィルタリングにおけるユーザの選択及び嗜好抽出の手法の提案(フィルタリング)(「夏のデータベースワークショップ(DBWS2003)」一般)
- ユーザの潜在嗜好モデルに基づいた協調フィルタリング手法 : ユーザの評価からユーザの嗜好の抽出(インターネット環境のコンテンツ技術及び一般)(セッション2「Web/コンテンツ処理」)
- 単語の意味関係を抽出する統計モデル選択についての考察 : ベイズ統計に基づく単語の意味関係抽出(抽出,マイニング)
- 単語の意味関係を抽出する統計モデル選択についての考察 : ベイズ統計に基づく単語の意味関係抽出(抽出, マイニング)(言語理解とコミュニケーション)
- 単語の意味関係を抽出する統計モデル選択についての考察 : ベイズ統計に基づく単語の意味関係抽出
- 情報・知識共有を支援する協調フィルタリングに関する研究 : 協調フィタリングの適用箇所拡大にむけた方法の提案
- 情報・知識共有を支援する協調フィルタリングに関する研究 : 協調フィルタリングの適用箇所拡大にむけた方法の提案(PRMU一般セッション(2))(認識と学習,模倣学習)
- B-16-19 微分行動を用いたレコメンド技術の提案
- 構造と特徴選択に着目した電子メールの分類手法の提案 : FromフィールドとJeffreys Perksを用いたナイーブベイズ分類(重要語抽出・検索・文書分類)
- 構造と特徴選択に着目した電子メールの分類手法の提案 : FromフィールドとJeffreys Perksを用いたナイーブベイズ分類(重要語抽出・検索・文書分類)
- Personal Data Mining Systemを用いた情報検索の提案 : パーソナルデータサーチの概念検索とパーソナライズ(DE: コンテンツ技術, データ工学とメディア理解との融合)
- Personal Data Mining Systemを用いた情報検索の提案 : パーソナルデータサーチの概念検索とパーソナライズ(DE: コンテンツ技術, データ工学とメディア理解との融合)
- ナイーブベイズに基づいたテキストフィルタリングにおける特徴選択手法に関する検討