摘要: 数据分析 : 是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律. 数据分析三剑客 - Numpy Pandas Matplotlib # 随机性固定 随机因子 np.random.seed(10) #固定时间种子 产生的随机数就固定下来了 np.random.randi 阅读全文
posted @ 2019-05-11 23:20 追风zz 阅读(204) 评论(0) 推荐(0) 编辑
摘要: # 增量式 爬虫 概念: 监测网站的数据更新的情况,只爬取网站更新的数据. 核心: 去重 实现 Redis set集合也行 -- 如何实现redis去重? -- 流程: scrapy startproject Name cd Name scrapy genspider -t crawl 爬虫文件名 阅读全文
posted @ 2019-05-11 17:02 追风zz 阅读(1097) 评论(0) 推荐(0) 编辑