摘要: 构造Requset 其实上面的urlopen参数可以传入一个request请求,它其实就是一个Request类的实例,构造时需要传入Url,Data等等的内容。 比如上面的两行代码,我们可以这么改写: 运行结果是完全一样的,只不过中间多了一个request对象,推荐大家这么写,因为在构建请求时还需要 阅读全文
posted @ 2018-03-08 17:00 耐烦不急 阅读(200) 评论(0) 推荐(0) 编辑
摘要: # coding=utf-8 import urllib params=urllib.urlencode({'t':1,'eggs':2,'bacon':0})#现在大多数网站都是动态网页,需要你动态地传递参数给它,它做出对应的响应。 print params ''' 所以,在访问时,我们需要传递数据给它。最常见的情况是什么?对了,就是登录注册的时候呀。 把数据用户名和密码传送到一个URL,然后... 阅读全文
posted @ 2018-03-08 16:34 耐烦不急 阅读(162) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: UTF-8 -*- # 正则表达式模块 import re # 获取路径模块 import urllib #时间模块 import time def getHtml(url): page=urllib.urlopen(url) print page.getcode() html=page.read() print html re... 阅读全文
posted @ 2018-03-08 13:55 耐烦不急 阅读(211) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: UTF-8 -*- # python2爬虫 import urllib f = urllib.urlopen("http://www.itcast.cn/") print f.readline() # 读取html页面的第一行 print f.read() # ,读取源代码,该网址源代码为utf-8格式 # read(),readline(),readlines... 阅读全文
posted @ 2018-03-08 13:51 耐烦不急 阅读(171) 评论(0) 推荐(0) 编辑