摘要: 拿到样本数据集之后,我们在进行数据挖掘之前,需要对样本数据集进行一个初步的了解。我们想要知道,这个样本数据集中,是否存在某些明显的规律或者是趋势,是否存在某些异常的数据值。我们可以通过验证数据集的数据质量、以图形的方式展示数据,或者计算某些重要的特征值来了解数据集。整个了解数据集的过程就是探索数据的 阅读全文
posted @ 2020-01-29 18:09 斜杠代码日记 阅读(614) 评论(0) 推荐(0) 编辑
摘要: Python环境搭建本次入门系列将使用Python作为开发语言。要使用Python语言,我们先来搭建Python开发平台。我们将基于Python 2.7版本、以及Python的开发发行版本Anaconda版本来开发。Anaconda指的是一个开源的Python发行版本,其包含了conda、Pytho 阅读全文
posted @ 2020-01-29 16:43 斜杠代码日记 阅读(424) 评论(0) 推荐(0) 编辑
摘要: 伴随着信息化系统建设的发展,各行各业的中大型企业都存储了大量的业务数据。很多的企业想要通过对这些数据的分析,来发现新的商机以及从这些数据中找到提高盈利的方法。大部分的企业,都是凭借管理人员的自身个人经验来开展这项工作。如果有一套系统,能够自动地或者半自动地发现相关的知识和解决方案,这样将会有效地提高 阅读全文
posted @ 2020-01-29 12:40 斜杠代码日记 阅读(365) 评论(0) 推荐(0) 编辑