J4 ›› 2006, Vol. 28 ›› Issue (12): 31-33.
• 论文 • 上一篇 下一篇
出版日期:
发布日期:
Online:
Published:
摘要:
本文针对目前Web信息挖掘中存在的各种问题,对网络爬虫系统进行研究,提出了一种基于HTTP协议原理、旨在减少网络爬虫系统运现有的Web链接数据库进行演化更新,可以在减少网络流量的同时获得接近现有网络爬虫系统的效果。
Abstract:
Face to the problems which exist in Web information mining the paper studies network crawler systems,and proposes a HTTP-based crawling method of in crement updating for reducing the network flow when a network crawler system runs. The method updates the current Web link database by the Web prefetch technique, and shows the effect close to the current network crawler systems when reducing the network flow.
刘必欣[1] 周斌[2] 贾焰[2]. 增量更新Crawler进行Web收集方法研究[J]. J4, 2006, 28(12): 31-33.
LIU Bi-xin ,ZHOU Bin ,JIA Yan. [J]. J4, 2006, 28(12): 31-33.
0 / / 推荐
导出引用管理器 EndNote|Ris|BibTeX
链接本文: http://joces.nudt.edu.cn/CN/
http://joces.nudt.edu.cn/CN/Y2006/V28/I12/31