D-039 A Comparison of Automatic Document Classification Methods for Vietnamese Language
スポンサーリンク
概要
- 論文の詳細を見る
Document classification, an important area of Text Mining, has many interesting applications such as email spam filtering. There have been many researches on document classification methods but mainly for English. Hence, we conducted a comparison of some well-known document classification methods including Decision Tree (DT), Naive Bayes classifiers, and Support Vector Machines (SVM) for Vietnamese language. The results showed that SVMs still got the highest performance whereas the performance of DT classifiers was not so high and the Naive Bayes classifiers were quite competitive.
- FIT(電子情報通信学会・情報処理学会)推進委員会の論文
- 2007-08-22
著者
-
小柳 滋
立命館大学大学院理工学研究科
-
上原子 正利
立命館大学理工学研究科
-
小柳 滋
立命館大学情報理工学部
-
GIANG SON
立命館大
-
YAMAZAKI Katsuhiro
立命館大
-
Oyanagi Shigeru
Ritsumeikan University Graduate School Of Science And Engineering
-
小柳 滋
立命館大
-
上原子 正利
立命館大学情報理工学部
関連論文
- 仮想出力キューイング方式に基づいた低遅延オンチップルータの開発 (システム開発論文特集)
- 5P-6 検索キーワードに応じて適切な検索APIを選択するメタ検索システムの開発(情報検索(1),学生セッション,データベースとメディア)
- D-026 ユーザビリティ向上を目指した検索結果の視覚化(データベース,一般論文)
- 仮想出力キューイング方式に基づいた低遅延オンチップルータの開発(並列・分散システム,システム開発論文)
- D-037 SNSにおけるアクセスコントロールのための信頼値の算出方法(データベース,一般論文)
- D-025 階層クラスタリングにおける新しい手法の提案(データベース,一般論文)
- D-033 C2C型オンラインマーケットにおける商品の推薦システム(D分野:データベース)
- 1X-9 複数の共通鍵暗号の同一FPGA上での比較(セキュア設計・実装・フォレンジクス,学生セッション,セキュリティ)
- 1N-5 SVMを用いたIDS異常検知のハードウェア設計(組込みとセキュリティ,学生セッション,アーキテクチャ)
- 1N-4 ネットワーク侵入検知のための文字列照合のハードウェア設計(組込みとセキュリティ,学生セッション,アーキテクチャ)
- 協調フィルタリングにおける相関係数法の予測性能向上(情報検索,データ工学論文)
- LA-003 協調フィルタリングにおける相関係数法の改善手法の提案(A. モデル・アルゴリズム・プログラミング)
- Dual Renamingを用いたControl Independence(計算機システム)
- リアルタイムバースト検出手法の提案
- 6ZD-3 NoCにおけるマルチパスルーティング(ネットワークと専用アーキテクチャ,学生セッション,アーキテクチャ)
- 5K-2 「Control Independence」におけるリソース管理手法の提案(マルチスレッドと省電力,学生セッション,アーキテクチャ)
- 2K-1 プロセッサ設計教育の実践と評価(プロセッサ設計とメモリシステム,学生セッション,アーキテクチャ)
- 4N-6 PHTエントリの破壊的競合を検知する手法とその効果(マルチスレッドと分岐予測,学生セッション,アーキテクチャ)
- C-010 CHAIN手法を用いたプロセッサのアウトオブオーダ実行(C分野:ハードウェア・アーキテクチャ)
- M_042 CHAIN手法とRENAME手法を混用するスーパースカラプロセッサの設計と評価(M分野:アーキテクチャ・ユビキタス・セキュリティ)
- D-021 単語クラスタリングを用いた検索キーワードの提示(データベース,一般論文)
- C-009 学生によるプロセッサ設計実験に基づいたハード/ソフト協調学習システムの評価(ハードウェア・アーキテクチャ,一般論文)
- C-004 キャッシュ上のタグビットを用いたバッファオーバーフロー防止手法(ハードウェア・アーキテクチャ,一般論文)
- 6S-3 ブログ検索エンジンにおける話題兆候の発見(ユーザ指向・推薦,学生セッション,データベースとメディア)
- 4S-1 SNSにおける信頼値に基づいたアクセスコントロール(SNS,ブログ,ソーシャルWeb,学生セッション,データベースとメディア)
- D-039 A Comparison of Automatic Document Classification Methods for Vietnamese Language
- D-038 Hierarchical Clustering and Bisecting K-Means in producing Time Series Patent Map
- D-007 ばねモデルを用いた検索結果のグラフレイアウト手法(D分野:データベース)
- C-013 冗長二進数を用いたRSA暗号回路(C分野:ハードウェア・アーキテクチャ)
- LC-008 Three stages pipelined MD5 implementation on FPGA
- LC-002 プロセッサ設計支援ツールの設計・実装とハード/ソフト協調学習システムの評価(ハードウェア・アーキテクチャ)
- D_008 A Framework for Top-k Frequent Closed Patterns Mining
- D-006 Accumulative Mining of Frequent Patterns
- WWWアクセスシーケンスの新しいマイニング手法の提案(データマイニング・データウェアハウス)
- 4Q-3 複数のウィンドウサイズに対応したリアルタイムバースト検出手法の提案(ストリーム・空間検索,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- D-026 動的カテゴリ生成機能を備えたオンラインマーケットの開発(D分野:データベース)
- 2M-4 NoCにおけるQoS方式の提案とその評価(ネットワークアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- C-011 スーパースカラプロセッサにおけるALU chainingとロード値予測を併用したデータ依存の軽減手法(C分野:ハードウェア・アーキテクチャ,一般論文)
- C-005 NoCにおける動的仮想チャネル分割によるQoSの実現とその評価(C分野:ハードウェア・アーキテクチャ,一般論文)
- O-015 プロフサイト内の人間関係解析によるネットパトロール支援に関する研究(O分野:情報システム,一般論文)
- O-014 プロフサイトの内容解析による非行逸脱行為判定手法の検討(O分野:情報システム,一般論文)
- 2S-1 ゆるやかな密度変化に対応するLDBSCANの拡張(マイニング・地理情報,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 1R-9 検索連動広告における広告選択手法の提案(Web検索支援,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- D-004 P2P情報検索におけるDHTの階層化の提案(データベース,一般論文)
- C-016 IDSにおけるハードウェアでのパターンマッチング性能検証(ハードウェア・アーキテクチャ,一般論文)
- C-010 仮想出力キューイング方式に基づいた低遅延ルータのFPGA実装・評価(ハードウェア・アーキテクチャ,一般論文)
- RC-001 Dual Renamingを用いたControl Independenceアーキテクチャ(ハードウェア・アーキテクチャ,査読付き論文)
- C-012 Control Independenceアーキテクチャに適した分岐合流点の動的予測手法(C分野:ハードウェア・アーキテクチャ,一般論文)
- D_054 SNSにユーザ信頼値を付与した推薦システム(D分野:データベース)
- D_055 SNSにおけるユーザの関係の視覚化(D分野:データベース)
- C-002 リコンフィギュラブル・ハードウェアによるテンプレート・マッチングの設計(C分野:アーキテクチャ・ハードウェア)
- D-020 x-means法における分割停止規準の改良(データベース,一般論文)
- 1N-6 Four-stage Pipelining for Two Messages in MD5 Implementation with Data Forwarding
- ピンポンアルゴリズムの拡張
- N_009 ハード/ソフト協調学習のための命令セット定義ツールとプロセッサデバッガの開発(N分野:教育・人文科学)
- M_047 パケットフィルタリングのハードウェア設計(M分野:アーキテクチャ・ユビキタス・セキュリティ)
- M_045 文字列照合のハードウェア設計(M分野:アーキテクチャ・ユビキタス・セキュリティ)
- D_023 検索のパーソナライズにおける文脈の追随(D分野:データベース)
- C_002 Handel-CによるSHA-1の設計とハードウェア/ソフトウェア最適分割の検討(C分野:ハードウェア)
- LC_005 ハイブリッド並列プログラミングによるMPEG2エンコーダの高速化(C分野:ハードウェア)
- ニュース・ウェブログ記事集約サイトの開発(ネットワーク・並列分散システムソフトウェア, システム開発論文)
- K-039 データマイニング手法を用いたマークシートテストの分析(K.ヒューマンコミュニケーション&インタラクション)
- C-034 ハード/ソフト最適分割を考慮したAES暗号システムとJPEGエンコーダの設計と検証(C分野:アーキテクチャ・ハードウェア)
- C-009 FPGAを用いたプロセッサ検証システムの設計と実装(C分野:アーキテクチャ・ハードウェア)
- ハード/ソフト・コラーニングシステムにおける各種マイクロプロセッサの設計と実装(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- ハード/ソフト・コラーニングシステムにおける各種マイクロプロセッサの設計と実装(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- ハード/ソフト・コラーニングシステムにおける各種マイクロプロセッサの設計と実装(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- A FPGA Based Hardware/Software Co-learning System
- C-030 Superscalar Microprocessor Design in a Hardware Software Co-learning System
- E-015 A Study on Enhancing Vietnamese Text Classification by Using an Ontology
- D_047 Research on Text Mining Techniques to support Patent Map generation
- D-007 Tree-based Parallel Algorithms with Reduced Inter-Processor Communication for Association Rule Mining
- C-018 Hardware Design and Cost Evaluation of a Speculative Selection Router
- C-003 ダイナミック・リコンフィギュラブル・プロセッサの応用と評価(C分野:アーキテクチャ・ハードウェア)
- C-001 教育用マイクロプロセッサの設計とFPGAボード上での検証(C分野:アーキテクチャ・ハードウェア)
- A-030 PCクラスタ上でのJPEGエンコーダ・デコーダの並列化(A分野:モデル・アルゴリズム・プログラミング)
- LC-001 マイクロプロセッサの設計と検証に基づいたハード/ソフト・コラーニングシステムの拡張(C分野:アーキテクチャ・ハードウェア)
- D-046 Webコンテンツマイニングによるページ間の類似性の判定ツール(D.データベース)
- D-023 Evaluation of Parallel Algorithms for Association Rules Mining
- B-006 Performance Evaluation of Treecode Algorithm for N-Body Simulation Using GridRPC System
- LC-008 プロセッサアーキテクチャ教育用FPGAボードコンピュータシステムの開発(C. アーキテクチャ・ハードウェア)
- Web上の技術情報と企業間の関係を用いた提携企業推薦
- マイクロブログから抽出した地物情報と投稿間隔を考慮した位置情報推定
- ECサイトへの訪問キーワードに着目したアクセス動向の可視化手法の提案
- 行列操作としての頻出アイテム集合列挙
- 行列上の相互順序決定
- 内積縮退MC:類似行の検出と類似列の検出を組み合わせたマトリクスクラスタリングアルゴリズム
- 著者属性の推定結果を用いたプロフの出会い目的の書き込み検出のための教師データ自動構築手法 (データベース Vol.4 No.3)
- リアルタイムバースト解析手法の提案
- 分岐予測ミスの偏りを利用した分岐予測器の提案 (コンピューティングシステム Vol.4 No.4)
- 大規模WebサイトにおけるWebアクセスログの最長共通部分列を用いた推薦の高速化手法(情報推薦,データ工学と情報マネジメント論文)
- B-035 GPUを考慮した並列分散GAの高速処理(GPGPU,B分野:ソフトウェア)
- C-001 分岐予測ミスの偏りとローカル履歴の規則性を利用した分岐予測器の提案(計算機アーキテクチャと並列処理,C分野:ハードウェア・アーキテクチャ)