摘要: 小说网 https://www.qu.la/paihangbang/ 功能:抓取每个排行榜内的小说名和对应链接,然后写入excel表格里面。 按F12 审查页面元素可以得到你所要的信息的class,从而来定位。 具体看代码讲解吧。 本次主要是记录编码问题。 编写完后run完出来是一个乱码的excel 阅读全文
posted @ 2018-06-08 18:21 IrisLeems 阅读(824) 评论(0) 推荐(0) 编辑
摘要: 这是小白学习笔记....大神勿喷。 本次学习糗事百科的网络爬虫。 http://blog.csdn.net/pleasecallmewhy/article/details/8932310 因为那个糗事百科网页改版了,content类中已经没有title...所以源码也有所改动。 所以找到一个改进版的 阅读全文
posted @ 2016-08-26 18:56 IrisLeems 阅读(726) 评论(0) 推荐(0) 编辑
摘要: 一个简单的百度贴吧爬虫程序: 代码: 学习笔记: 定义一个百度函数,这个函数可以将你所要爬虫的贴吧网页保存到本地。 函数三个参数: sName为保存到本地的文件名 string.zfill(i,5)保证文件名为6位数字 sName = string.zfill(i,5) + '.html'#自动填充 阅读全文
posted @ 2016-08-24 16:50 IrisLeems 阅读(258) 评论(0) 推荐(0) 编辑
摘要: 最近,因为课程要求,所以接触了Orchard。自己看了很多资料,最有用的当然是官网http://docs.orchardproject.net/ 里面很多教程,唯一不好的就是全英。里面讲的很详细,也正是因为详细所以在每次课程里主要步骤有点混淆(可能是我英语不太好吧).... 所以为了记录我这次学习, 阅读全文
posted @ 2016-04-22 11:27 IrisLeems 阅读(384) 评论(1) 推荐(0) 编辑