摘要: scrapy beautifulsoup selenium 滑动验证码 Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Goog 阅读全文
posted @ 2018-11-02 22:09 一小白 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘引论 为什么进行数据挖掘 简单的说就是信息化时代,数据量太大,仅仅靠人自己来发现信息中的可用信息代价太高,所以数据挖掘崛起。 随着数据挖掘崛起,出现了一个名词,数据仓库,它是一种多个异构数据源在但个站点以统一的模式组织的存储,数据仓库技术包括数据清理、数据集成和联机分析处理(OLAP)。 下 阅读全文
posted @ 2018-11-02 15:23 一小白 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘引论为什么进行数据挖掘简单的说就是信息化时代,数据量太大,仅仅靠人自己来发现信息中的可用信息代价太高,所以数据挖掘崛起。随着数据挖掘崛起,出现了一个名词,数据仓库,它是一种多个异构数据源在但个站点以统一的模式组织的存储,数据仓库技术包括数据清理、数据... 阅读全文
posted @ 2018-11-02 15:23 一小白 阅读(157) 评论(0) 推荐(0) 编辑
摘要: 原文链接聚类算法聚类是一种经典的无监督学习方法,无监督学习的目标是通过对无标记训练样本的学习,发掘和揭示数据集本身潜在的结构与规律,即不依赖于训练数据集的类标记信息。聚类则是试图将数据集的样本划分为若干个互不相交的类簇,从而每个簇对应一个潜在的类别。聚类直观... 阅读全文
posted @ 2018-11-02 09:43 一小白 阅读(1631) 评论(0) 推荐(0) 编辑