• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2005, Vol. 27 ›› Issue (12): 4-6.

• 论文 • 上一篇    下一篇

集群Web服务器预取机制中用户会话聚类的研究与实现

吴集 王晓川 金士尧   

  • 出版日期:2005-01-01 发布日期:2010-06-22

  • Online:2005-01-01 Published:2010-06-22

摘要:

本文研究了使用集群环境下的用户访问日志数据生成用户会话聚类的方法:编制Perl脚本从用户访问日志中生成用户会话,以新的相似度度量取代欧几里德距离改进Leader算  法对用户会话集合进行聚类,并计算聚类的内部距离和间隔距离来验证算法的有效性。实验结果表明,这种实现能有效地对用户访问日志进行聚类,并能满足服务器预取机制
制在线分析的时间、空间要求。

关键词: 集群服务器 用户访问模式 预取 相似度 聚类分析

Abstract:

Using the user access log taken in the environment of the cluster server, we propose an implementanon ot user sessions clustering which is indispensab   le to the pre-fetching component. We develop a Perl script to generate the user session set from user access log files, and then enhance the Leader clus  tering algorithm using a new similarity metric instead of the Euclidean distance. Also, we calculate the inlernal distances and interval distances of cl  usters to evaluate the algorithm. Experimental results show that the implementation can cluster the user access logs effectively, and the temporal and s  pecial efficiency can meet the on-the-fly need of Web server pre-fetching.

Key words: (cluster server, user access pattern, pre-fetching, similarity, clustering analysis)