Feature Selection and Integration in Automatic Classification of Japanese Texts
スポンサーリンク
概要
- 論文の詳細を見る
We explore the problem of automatic text clas-sification using Japanese documents. Unlike other languagesthat use roman letters, Japanese language poses a problem ofnot availing word boundary information. As such bag-of-wordsapproach in constructing features may not be sufficient to en-hance machine learning techniques. We propose a method forfeature selection and construction to improve automatic clas-sification performance of Japanese texts. Our approach in-volve extracting syntactic word categories and Chinese charac-ters (Kanji) separately. Then we combine the extracted infor-mation to build an informative feature set. We carried out var-ious experiments using four learning algorithms to evaluate itseffectiveness. The proposed method generally outperformed itscounterparts method for Japanese document representation.
論文 | ランダム
- モーダル差分構造法とGuyanの静縮約による区分モード合成法の一般化(機械力学,計測,自動制御)
- 自動車用の制振防音構造の三次元有限要素法による減衰応答解析 : 二重壁間の連結部材のモード減衰への影響(機械力学,計測,自動制御)
- 周期的微細構造によるSAW位相・周波数変調デバイス(第1回マイクロ・ナノ工学シンポジウム)
- 表面微細構造による輻射場操作を用いた放熱技術の検討(第1回マイクロ・ナノ工学シンポジウム)
- 中空繊維状基材内微細セル状構造作成プロセス(第1回マイクロ・ナノ工学シンポジウム)