統計的分類手法による英文新聞記事のテキスト自動分類
スポンサーリンク
概要
- 論文の詳細を見る
The basic process of automatic text classification is learning a classification scheme from training examples then using it to classify unseen textual documents. It is essentially the same as graphic or character pattern recognition process. So the pattern recognition approaches can be used for automatic text categorization. In this research several statistical classification techniques each of which employs Euclidean distance, various similarity measures, linear discriminant function, projection distance, modified projection distance, SVM, nearest-neighbor, have been used for automatic text classification. The principal component analysis was used to reduce the dimensionality of the feature vector. Comparative experiments have been conducted on the Reuters-21578 test collection of English newswire articles. The results illustrate that the efficiency of modified projection distance is totally better than the other methods and the principal component analysis is suitable for reducing the dimensionality of the text features.
- 社団法人 電気学会の論文
- 2004-03-01
著者
-
木村 文隆
三重大学大学院工学研究科
-
Ohyama Wataru
Graduate School Of Engineering Mie University
-
木村 文隆
三重大学工学部
-
大山 航
三重大学工学部
-
若林 哲史
三重大学工学部
-
祖 国威
三重大学工学部情報工学科
関連論文
- 濃度こう配特徴の導入による顔画像認証の高精度化(一般セッション1,複合現実感のためのパターン認識・理解)
- 地籍図のつなぎ合わせのための方眼格子による方位推定(一般セッション4,複合現実感のためのパターン認識・理解)
- 超音波による心筋機能の定量評価--心筋壁内部運動の高精度追跡とその応用
- 超音波RF信号からの局所心筋の運動追跡による心筋を対象とした運動機能評価指標(医用システム)
- 一般化 Hough 変換による地籍図の再構成
- 濃度こう配特徴を用いた全自動正面顔認識(テーマ関連セッション3)
- 濃度こう配特徴を用いた全自動正面顔認識(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- 超音波RF信号を対象としたアクティブネットを使用した局所心筋の運動追跡(一般セッション,センシング技術とその応用)
- MRタギング画像からの左心室心筋内タグ交点の完全自動抽出(一般セッション,センシング技術とその応用)
- 色ヒストグラムを用いた虫画像の分類(一般セッション,センシング技術とその応用)
- 混合識別関数による類似文字認識の高精度化
- 混合識別関数による手書き漢字認識
- 手書き英単語の局所傾き推定と補正
- 非線形正規化と特徴量の圧縮による手書き漢字認識の高精度化
- 13.超音波RF信号を用いた動態解析に基づく頸動脈壁性状評価(東海支部大会抄録)
- 1. 超音波画像上の動態解析に基づく頸動脈壁性状評価(平成16年度日本エム・イー学会東海支部学術集会, 支部大会抄録)
- An impact of parts of speech analysis on automatic classification of OCR texts (パターン認識・メディア理解)
- 濃度こう配特徴を用いた顔画像の照合と認識(テーマ関連,顔・人物・ジェスチャ・行動)
- 濃度こう配特徴を用いた顔画像の照合と認識(テーマ関連,顔・人物・ジェスチャ・行動)
- 文字認識研究の新たな展開に向けて : 郵便番号データにみる手書き数字認識の現状
- 方眼格子による方位推定と地籍図のつなぎ合わせ
- チェインコード化Merlin-Farber法を用いた正面顔正中線の自動抽出
- 超音波RF信号を対象としたアクティブネットを使用した局所心筋の運動追跡(一般セッション,センシング技術とその応用)
- 超音波RF信号に信頼度付き階層的相関法を用いた心筋層内局所機能評価(超音波)
- Motion Tracking of Local Myocardial Tissue Using DP Tracking Method on M-mode Echocardiogram(International Forum on Medical Imaging in Asia 2009 (IFMIA 2009))
- Automatic facial midline detection and its impact on facial feature extraction (コンピュータビジョンとイメージメディア)
- Automatic facial midline detection and its impact on facial feature extraction (ヒューマン情報処理)
- Automatic facial midline detection and its impact on facial feature extraction (パターン認識・メディア理解)
- 濃度こう配特徴を用いた全自動正面顔認識(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- MRタギング画像からの左心室心筋内タグ交点の完全自動抽出(一般セッション,センシング技術とその応用)
- 色ヒストグラムを用いた虫画像の分類(一般セッション,センシング技術とその応用)
- 速度算出方法の適応的組み合わせ手法による頸動脈壁運動追跡の高精度化(CADMセッション)
- 改良型複数ROI結合相関法による高解像度超音波画像を用いた心筋運動追跡(CADMセッション)
- 14.超音波RF信号を用いた心筋壁の2次元運動追跡(東海支部大会抄録)
- 12.超音波信号を用いた大動脈弁の動態解析(東海支部大会抄録)
- 11.磁気標識付きMR画像からの心臓領域とタグの自動抽出(東海支部大会抄録)
- 3. 磁気標識付きMR画像からの心臓領域とタグの自動抽出に関する研究(平成16年度日本エム・イー学会東海支部学術集会, 支部大会抄録)
- 複数ROI結合相関法による局所心筋壁運動の自動追跡
- 9. 動的輪郭モデルによる高解像度超音波断層像からの頸動脈壁の抽出(平成15年度東海支部学術集会)
- こう配特徴ベクトルと変動吸収共分散行列による手書き漢字認識の高精度化
- 濃度こう配特徴を用いたオンライン署名照合の高精度化
- 超音波ドップラー信号を用いた相関加重位相差法による局所心筋壁運動の自動追跡(超音波)
- 2重しきい値法を用いた超音波心断層像からの心内膜輪郭線自動抽出とその信頼性の検討
- 重しきい値法による心内膜の完全自動抽出
- 心エコー画像における局所心筋壁2次元運動の追跡
- 局所心筋壁機能評価のための2次元カラーフローマッピング画像の機能表示
- フレーム間差分連続画像を用いた各心時相における局所心筋壁運動の定量化
- かな文字特徴抽出による「奥の細道」筆写本の筆者認識支援
- T2-2 文書認識・文書処理
- 手書き数字認識における特徴量の合成
- DPトラッキング法による局所心筋運動の自動追跡 (医用画像)
- DPトラッキング法による局所心筋運動の自動追跡 (パターン認識・メディア理解)
- DPトラッキング法による局所心筋運動の自動追跡 (画像工学)
- 非線形マッピングによるサーフェースモデルの平面展開と復元のアルゴリズム
- ベイズアプローチによる最適識別系の有限標本効果に関する考察 : 学習標本の大きさがクラス間で異なる場合 (パターン認識のための学習 : 基礎と応用)
- 有限標本に基づく最適識別器の設計と誤り確率の評価
- 自己想起回路による手書き数字認識
- ベイズアプローチによる最適識別系の有限標本効果に関する考察 : 学習サンプル数がクラス間で異なる場合
- こう配特徴ベクトルと変動吸収共分散行列による手書き漢字認識の高精度化
- 濃度こう配の方向と曲率を用いた手書き数字認識
- FAにおける低品質文字列の認識
- 競合自己想起回路による手書き数字認識
- 濃度こう配の方向と曲率を用いた手書き数字認識
- 少クラス分類問題における特徴選択に関する考察
- 鋼材に印字された低画質文字列の認識
- Improving automatic text classification by integrated feature analysis
- チェインコード化 Merlin-Farber 法を用いた正面顔正中線の自動抽出
- 方眼格子による方位推定と地籍図のつなぎ合わせ
- 濃度こう配特徴を用いたオンライン署名照合の高精度化
- 英文OCRにおける接融文字の切り出しアルゴリズム
- 3次元空間中の文字の認識に関する研究(テーマセッション,文字・文書の認識と理解)
- DPトラッキング法による局所心筋運動の自動追跡(テーマセッション,医用画像処理分野における計測・認識・理解)
- DPトラッキング法による局所心筋運動の自動追跡(テーマセッション,医用画像処理分野における計測・認識・理解)
- DPトラッキング法による局所心筋運動の自動追跡(テーマセッション,医用画像処理分野における計測・認識・理解)
- 超音波による心機能評価--高精度局所心筋運動追跡の実現と応用
- 統計的分類手法による英文新聞記事のテキスト自動分類
- 自己想起回路の鏡像学習による手書き数字認識
- 自己想起回路による手書き数字認識の誤り訂正学習
- 手書き文字認識の高精度化と文書画像認識
- 拡張辞書単語マッチングによる手書き住所認識
- 非線形正規化と特徴量の圧縮による手書き漢字認識の高精度化
- 手書き文字認識における非線形正規化法の改良
- 3次元回転文字の角度推定に関する研究(テーマセッション,実世界文字認識と理解)
- ランレングス特徴による文書画像のレイアウト解析(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- 文字の回転に対して頑健な文字認識手法(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- 正六角形ゾーニングによる文字の特徴抽出と認識(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- ランレングス特徴による文書画像のレイアウト解析(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- 文字の回転に対して頑健な文字認識手法(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- 正六角形ゾーニングによる文字の特徴抽出と認識(ポスター講演,ポスターショートオーラル,時系列パターン認識)
- ランレングス特徴による文書画像のレイアウト解析
- 手書き数字認識における特徴選択に関する考察
- 正面顔画像からの両目検出のGPGPUを用いた高速化(ポスターセッション,大規模データベースとパターン認識)
- 円のHough変換と濃度こう配ヒストグラムを用いる顔画像の特徴点検出(ポスターセッション,大規模データベースとパターン認識)
- 毛筆書写熟練度を定量評価する手法の開発(テーマセッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
- 手書き文字認識における特徴量の次元数と変数変換に関する考察
- 超音波心エコー画像を用いた双方向DPトラッキング(テーマセッション,医用画像の計測・認識・理解,少子高齢化社会の課題)
- 超音波心エコー画像を用いた双方向DPトラッキング(テーマセッション,医用画像の計測・認識・理解,少子高齢化社会の課題)
- 超音波心エコー画像を用いた双方向DPトラッキング(テーマセッション,医用画像の計測・認識・理解,少子高齢化社会の課題)