HTTPログファイルからの情報抽出によるインターネットドメインの分析く
スポンサーリンク
概要
- 論文の詳細を見る
WWW (World-Wide Web)の通信プロトコルであるHTTP (Hyper Text Transfer Protocol)のアクセスログファイルは, キャッシュサーバの最適配置や強調キャッシュのトポロジー設計などに役立つ有用な情報を含むと考えられる.しかし, 大規模サイトにおいてはその量の多さが障害になり, 十分な分析を行うことが困難になっている.本論文では, 文献検索の分野で近年利用されている自動索引付け手法LSI(Latent Semantic Indexing)を大規模ログファイルに適用して, ホストドメイン間の類似度を求める手法を検討する.特に膨大なログデータを扱うために, URL階層上でカルバック情報量を尺度としてデータの要約を試み, その効果を実際のログデータを用いて検証する.
- 1998-11-25
論文 | ランダム
- 鉄道総研 スピ-ドアップに資する近年の研究成果と今後の課題 (特集 速達化)
- Validity and Reliability of Gait Assessment with Benesh Movement Notation-for analysis of the walking of adult hemiplegic patients-
- スポ-ツ選手の食事--長距離ランナ-の食事 (特集 運動する人への食事指導)
- 繊維強化プラスチック材料の振動減衰同定に及ぼす大気圧の影響(機械力学,計測,自動制御)
- 病院給食院外調理の必要性と課題 (病院給食規制緩和--院外調理で何が変わるか)