摘要: 有时候读取同一个url,服务器可能会返回不同的response,并不是爬虫程序代码的问题,而是服务器的问题,初次试验request时,最好把response文本保存在一个txt文件当中,以便后续的比对。得到response文本之后就可以利用正则表达式或通过查找字符串来获取信息了。 只做get请求时,requests.get(url)和urllib.open(url).read()效果是相同的。 要熟练使用requests库或urllib2库,做get,post请求数据,设置参数,获取head及body。(待续) 阅读全文
posted @ 2016-03-07 19:39 morein2008 阅读(177) 评论(0) 推荐(0) 编辑
摘要: Java字符串的split方法可以分割字符串,但和其他语言不太一样,split方法的参数不是单个字符,而是正则表达式,如果输入了竖线(|)这样的字符作为分割字符串,会出现意想不到的结果, 如, String str="中国|广东|深圳"; String[]location=str.split("|" 阅读全文
posted @ 2016-03-07 16:44 morein2008 阅读(208) 评论(0) 推荐(0) 编辑