摘要: 2012-03-07 11:59:00 浏览数(3048) 评论数(0)来自百度站长俱乐部的消息:百度网页搜索spider(也就是大家俗称的百度爬虫、百度蜘蛛)的User-Agent字段内容于2011年5月10日更新。查看网站日志时会发现,以前baiduspider在爬取网页时,发送请求的User-Agent字段是这样的:Baiduspider+(+http://www.baidu.com/search/spider.htm)更新后的baiduspider User-Agent字段内容内容为:Mozilla/5.0 (compatible; Baiduspider/2.0; +http:/.. 阅读全文
posted @ 2013-11-19 10:31 电工男 阅读(785) 评论(0) 推荐(0) 编辑
摘要: https://github.com/tianqiq/CloudStore.git 阅读全文
posted @ 2013-11-19 10:01 电工男 阅读(180) 评论(0) 推荐(0) 编辑
摘要: using System;using System.Collections.Generic;using System.Text;using System.Net;using System.Web;using System.IO;using System.Collections;using System.Text.RegularExpressions;namespace chinaz{ class Program { static void Main(string[] args) { string cookie = null; ... 阅读全文
posted @ 2013-11-19 09:46 电工男 阅读(503) 评论(0) 推荐(0) 编辑
摘要: 百度爬虫 * Baiduspider+(+http://www.baidu.com/search/spider.htm”) google爬虫 * Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) * Googlebot/2.1 (+http://www.googlebot.com/bot.html) * Googlebot/2.1 (+http://www.google.com/bot.html) 雅虎爬虫(分别是雅虎中国和美国总部的爬虫) ... 阅读全文
posted @ 2013-11-19 09:43 电工男 阅读(262) 评论(0) 推荐(0) 编辑
摘要: GOOGLE---------------------------------------------------------------------66.249.70.212 - - [11/Jan/2009:00:03:35 -0700] "GET www.vidun.com/user-f2fc990265c712c49d51a18a32b39f0c.html?umid=f2fc990265c712c49d51a18a32b39f0c HTTP/1.1" 200 8148 "-" "Mozilla/5.0 (compatible; Goog 阅读全文
posted @ 2013-11-19 09:35 电工男 阅读(1278) 评论(0) 推荐(0) 编辑