摘要: 在Python中通过导入urllib2组件,来完成网页的抓取工作。在python3.x中被改为urllib.request。 爬取具体的过程类似于使用程序模拟IE浏览器的功能,把URL作为HTTP请求的内容发送到服务器端, 然后读取服务器端的响应资源。 实现过程: 将返回的html信息打印出来,这和 阅读全文
posted @ 2016-11-24 17:12 SeeKHit 阅读(4217) 评论(0) 推荐(0) 编辑