摘要: 工欲善其事必先利其器,在使用Python做数据挖掘和数据分析时,一大必不可少的利器就是Pandas库了。pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的,其纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。 下面就从创建数据、查看数据、筛选数据、 阅读全文
posted @ 2018-07-03 16:59 飞末 阅读(1178) 评论(0) 推荐(0) 编辑
摘要: 一、概述 我们知道,机器学习的特点就是:以计算机为工具和平台,以数据为研究对象,以学习方法为中心;是概率论、线性代数、数值计算、信息论、最优化理论和计算机科学等多个领域的交叉学科。所以本文就先介绍一下机器学习涉及到的一些最常用的的数学知识。 二、线性代数 2-1、标量 一个标量就是一个单独的数,一般 阅读全文
posted @ 2018-07-03 16:24 飞末 阅读(544) 评论(0) 推荐(0) 编辑