python网络编程

刚才开始总会报找不到urlopen的错误  在网上看是因为在这个项目下游其他的.py代码影响了??
然后就关了原来的项目重新建立了一个项目就好使了~~~我也不知道为啥~~
from urllib import urlopen 
import re
webpage=urlopen('http://www.python.org')
text=webpage.read()
m=re.search(' <a href="([^"]+)" .*?>About</a>',text)
print m.group()

这里有个问题~我输出的结果是:<a href="/about/" title="" class="">About</a>
但是在这个网页的源代码里并没有这句话啊~~~~只有一个与他相近的

呃呃呃。。。希望哪位好心人能告诉我下~~~~~~~呜呜呜~~~~~~~~~~


言归正传
通过url获取网页内容
import urllib2

response = urllib2.urlopen("http://www.baidu.com")
print response.read()

 构造Requset

import urllib2

request = urllib2.Request("http://www.baidu.com")
response = urllib2.urlopen(request)
print response.read()

当url地址含有中文,或者参数有中文的时候,这个算是很正常了,但是把这样的url作为参数传递的时候(最常见的callback),需要把一些中文甚至'/'做一下编码转换。

>>> from urllib import urlencode
>>> data = {
...     'a': 'test',
...     'name': '魔兽'
... }
>>> print urlencode(data)
a=test&name=%C4%A7%CA%DE

  

posted @ 2016-06-08 16:48  奋斗中的菲比  阅读(215)  评论(0编辑  收藏  举报