代码改变世界

随笔档案-2015年09月

python爬虫实战

2015-09-06 19:43 by 神马木牛, 276 阅读, 收藏,
摘要: 任务:需要获取的内容:廖雪峰的官方网站中的python部分的标题和内容,之后获取整个python教程的内容,而不仅仅是这一个页面:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000 对h 阅读全文

Python爬虫入门

2015-09-06 19:40 by 神马木牛, 503 阅读, 收藏,
摘要: 一、使用正则表达式实现爬虫: Import requests,re 获取网页源码:htmlsource=requests.get(url).text 使用正则表达式匹配网页中的内容: Re模块常用的函数 Re.findall(pattern,string,flags=0) #返回内容为包含匹配结果的 阅读全文