摘要: 恩,写在最前面。肯定是不能抓取VIP章节的,因为这违法了,(其实是我不会) 今天朋友告诉我,他看小说的时候,因为成片成片的错别字,经常是看着看着就看不下去,问我有啥办法解决 我说,你去正版网站看不就没事了...... 他说,你不是会爬虫吗,你帮我爬下来...... 我说,就我这菜*水平,普通章节吧. 阅读全文
posted @ 2017-08-25 17:24 秦·川 阅读(851) 评论(1) 推荐(0) 编辑
摘要: 有时候因为某些需求需要爬取某个网页中某个表格里的数据,这时候如果这个页面只有这一个表格的时候,那么抓取就比较容易了,但是当这个页面中有大量的表格的时候,再使用之前的方法,就会发现虽然也能抓取到要的数据,但是还有一大堆冗余。 这时候,就可以使用下面这种方法 就以这个网页里的表格为例 阅读全文
posted @ 2017-08-18 18:33 秦·川 阅读(3256) 评论(0) 推荐(0) 编辑
摘要: 创建数据库语句 注意:创建数据库时,必须加上这句话 ENGINE =INNODB DEFAULT CHARSET = utf8; 阅读全文
posted @ 2017-08-17 21:17 秦·川 阅读(613) 评论(0) 推荐(0) 编辑
摘要: 1.shape 返回的是一个包含数组维度的元组,它也可以用于调整数组大小 2.reshape 用来调整数组的大小 3.zeros 返回特定大小,以 0 填充的新数组。 4.asarray 将数据转化为 np格式的数组 5.arange 这个函数返回ndarray对象,包含给定范围内的等间隔值 6.l 阅读全文
posted @ 2017-08-17 21:13 秦·川 阅读(124) 评论(0) 推荐(0) 编辑
摘要: Pandas的数据类型 Pandas基于两种数据类型: series 与 dataframe 。 Series 一个series是一个一维的数据类型,其中每一个元素都有一个标签。类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。 import numpy as np import 阅读全文
posted @ 2017-08-17 18:45 秦·川 阅读(199) 评论(0) 推荐(0) 编辑