首页 | 本学科首页   官方微博 | 高级检索  
     

搜索引擎的渐增式爬行和备份式更新模式
引用本文:沈文勤 李庆超 邵志清. 搜索引擎的渐增式爬行和备份式更新模式[J]. 医学教育探索, 2004, 0(3): 284-287
作者姓名:沈文勤 李庆超 邵志清
作者单位:[1]华东理工大学计算机科学与工程系,上海200237 [2]焦作大学计算机工程系,焦作454003
基金项目:上海市青年科技启明星计划资助项目(99QD14038)
摘    要:
介绍了搜索引擎的总体结构,分析了搜索引擎中爬行器的爬行策略和网页库的更新模式。介绍了其中一种较为合理的爬行和更新模式及其实现技术,实现了渐增式地爬行高质量网页和提高网页库新鲜度的目的。

关 键 词:搜索引擎 爬行器 网页库 更新策略

Incremental Crawling and Shadowing Update Strategy in Search Engines
SHEN Wen-qin,LI Qing-chao,SHAO Zhi-qing. Incremental Crawling and Shadowing Update Strategy in Search Engines[J]. Researches in Medical Education, 2004, 0(3): 284-287
Authors:SHEN Wen-qin  LI Qing-chao  SHAO Zhi-qing
Affiliation:SHEN Wen-qin~,LI Qing-chao~,SHAO Zhi-qing~
Abstract:
This paper analyses the general architecture of search engine, especially the design and (implementation) technology of the crawling and update strategy, the crawler can download "high quality" Web pages incrementally and maintain the "freshness" of the Web repository.
Keywords:search engine  crawler  Web repository  update strategy
点击此处可从《医学教育探索》浏览原始摘要信息
点击此处可从《医学教育探索》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号