08 2016 档案

摘要:这是小白学习笔记....大神勿喷。 本次学习糗事百科的网络爬虫。 http://blog.csdn.net/pleasecallmewhy/article/details/8932310 因为那个糗事百科网页改版了,content类中已经没有title...所以源码也有所改动。 所以找到一个改进版的 阅读全文
posted @ 2016-08-26 18:56 IrisLeems 阅读(726) 评论(0) 推荐(0) 编辑
摘要:一个简单的百度贴吧爬虫程序: 代码: 学习笔记: 定义一个百度函数,这个函数可以将你所要爬虫的贴吧网页保存到本地。 函数三个参数: sName为保存到本地的文件名 string.zfill(i,5)保证文件名为6位数字 sName = string.zfill(i,5) + '.html'#自动填充 阅读全文
posted @ 2016-08-24 16:50 IrisLeems 阅读(258) 评论(0) 推荐(0) 编辑