単語出現頻度とブログ記事の構造に着目したフィルタリングによる適合ブログ記事検索(一般セッション,文字・文書の認識と理解)
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,ブログ記事から記事閲覧者にとって有用な記事を選別・抽出する手法を検討する.対象記事500,単語数19003から,idf値に基づいて単語数を100まで削減し,さらに主成分分析を用いて特徴ベクトルの次元を3〜5に削減した.単語ベクトルの構築には,単語の出現の有無を0または1の2値で表したもの,および,単語が出現した場合に1の代わりにtf-idf値を用いたもの(単語ヒストグラム)の2通りを用いた.ニューラルネットワーク(多層パーセプトロン)にて100記事を学習させ,別の4セットの100記事にて分類精度を測定した.この結果,分類精度は,単語ベクトルを用いた場合は,平均的に正答率70%,単語ヒストグラムでは正答率60%を得られた.この結果から,単語ヒストグラムでは正答率が下がるが,その代わり有用なものを不用と誤分類する割合が減少しており,再現率が高くなっているものと推定される.
- 2011-03-03
著者
関連論文
- 補間型ファジィ推論法(用語解説)
- 離散コサイン変換領域の特徴に基づいた画像索引作成法
- カメラによる物体移動情報に基づくドライバ注意領域の推定(J22-2 センサ・アクチュエータシステムとその知能化(2),J22 センサ・アクチュエータシステムとその知能化-実環境で活躍するメカトロニクスを目指して)
- BK-1-2 サラウンディング・コンピューティング技術による情報転送・再現(BK-1. JGN2の研究開発成果と次世代インターネットへの展開,ソサイエティ特別企画,ソサイエティ企画)
- サラウンディング・コンピューティング技術による情報転送・再現システム(インターネットアーキテクチャ技術-トランスポート、センサ、アプリケーション,インターネット、アプリケーション及び一般)
- D-11-123 ビジュアルキー型画像検索のためのクラスタリング法の改善(D-11. 画像工学,一般セッション)
- 周波数領域における特徴量を用いたビジュアルキー型画像検索(信号処理,スペクトル拡散,及び一般)
- 周波数領域における特徴量を用いたビジュアルキー型画像検索(信号処理,スペクトル拡散,及び一般)
- D,T,SRファジィフリップフロップの論理的性質 (第5回〔東京工業大学〕ネットワークシンポジウム講演論文集)
- 基礎シリーズ ファジィ論理とその応用(続き)
- 基礎シリーズ ファジィ論理とその応用
- t-normに基づいたヒストグラム交差法の提案と画像検索への応用
- 単語出現頻度とブログ記事の構造に着目したフィルタリングによる適合ブログ記事検索(一般セッション,文字・文書の認識と理解)
- ファジィメモリを用いたファジィ演算プロセッサ
- ファジィメモリ基本素子を用いたファジィコプロセッサ
- D, T, SRファジィフリップフロップの提案とFPGAを用いた回路設計