python 爬取html页面

 1 #coding=utf-8
 2 import urllib.request
 3 
 4 def gethtml(url):  
 5     page=urllib.request.urlopen(url)
 6     html=page.read().decode("utf-8")
 7     
 8     return html  
 9   
10 
11     
12 url="........"  
13 
14 html = gethtml(url)
15 
16 
17 print(html)

有些网站的页面无法全部爬取(笔记)

posted @ 2017-04-13 14:30  金牛小子  阅读(4845)  评论(0编辑  收藏  举报