摘要: 2.2 搜索引擎面对的挑战页面抓取需要快而全面 现在主流搜索引擎都已经能在几天之内更新重要页面,权重高的网站上的新文件几个小时甚至几分钟之内就会被收录。海量数据存储索引处理快速有效,具可扩展性 搜索引擎将页面数据抓取和存储后,还要进行索引处理,包括链接关系的计算、正向索引、倒排索引等。查询处理快速准确判断用户意图及人工智能 搜索引擎达到人工只能,了解用户搜索词的意义和目的。2.3搜索结果显示格式富摘要面包屑导航2.4 搜索引擎工作原理简介蜘蛛 蜘蛛会先访问网站根目录下的robots.txt文件。蜘蛛也有表明自己身份的代理名称。站长可以在日志文件中看到是搜索引擎的特定... 阅读全文
posted @ 2013-07-03 23:05 yumuxu 阅读(232) 评论(0) 推荐(0) 编辑
摘要: DotNetZip - Zip and Unzip in C#, VB, any .NET languagehttp://dotnetzip.codeplex.com/ 阅读全文
posted @ 2013-07-03 18:31 yumuxu 阅读(131) 评论(0) 推荐(0) 编辑