摘要: 1.打开韩寒博客列表页面 http://blog.sina.com.cn/s/articlelist_1191258123_0_1.html 目标是获取所有文章的超级链接 2.韩寒文章列表特征 <a title target... href=....html> 3.技术要点 ·字符串函数find · 阅读全文
posted @ 2016-07-21 21:14 vxee 阅读(236) 评论(0) 推荐(0) 编辑
摘要: 1.如何刷‘阅读次数’ 用while循环来控制 2.如何关闭浏览器 用taskkill来杀死进程,避免打开过多的网页占用太多cpu 阅读全文
posted @ 2016-07-21 11:08 vxee 阅读(119) 评论(0) 推荐(0) 编辑
摘要: Python 使用第三方库函数及简单网页爬虫示例 # -*- coding: utf-8 -*- import urllibimport webbrowser as weburl = "http://www.163.com"content = urllib.urlopen(url).read()op 阅读全文
posted @ 2016-07-21 09:31 vxee 阅读(125) 评论(0) 推荐(0) 编辑