python urllib
import urllib
print urllib.urlopen(r'http://image.baidu.com/i?tn=baiduimage&ct=201326592&lm=-1&cl=2&fr=ala0&word=%C5%AE%C8%CB&fr=ala_meinv').read()
使用wireshark抓包
显示npf没有启动的解决方法: net start npf, 显示“拒绝访问5”。
改用管理员方式运行cmd.exe, OK
python urllib 超时设置
import socket
socket.setdefaulttimeout(5.0)
Python模块学习 --- urllib
http://www.blogjava.net/ashutc/archive/2011/03/21/346695.html
import urllib
print urllib.urlopen('http://www.google.com').read()
urllib.urlretrieve(url[, filename[, reporthook[, data]]]):
urlretrieve方法直接将远程数据下载到本地。
def cbk(a, b, c):
'''回调函数
@a: 已经下载的数据块
@b: 数据块的大小
@c: 远程文件的大小
'''
per = 100.0 * a * b / c
if per > 100:
per = 100
print '%.2f%%' % per
url = 'http://www.sina.com.cn'
local = 'd:\\sina.html'
urllib.urlretrieve(url, local, cbk)