随笔分类 - 数据分析
摘要:Python中没有提供数组功能,虽然列表可以完成基本的数组功能,但并不是真正的数组,而且在数据量较大时,使用列表的速度回非常慢。因此,Numpy提供了真正的数组功能,以及对数据进行快速处理的函数。Numpy内置函数处理数据的速度是C语言级别的,因此,尽量使用其内置函数。 Numpy安装 Numpy安
阅读全文
摘要:在数据分析当中的东西还是很多的,我在这里只是启发式的介绍一下,了解到这方面的东西之后,使用的时候可以更快的找到解决办法,希望能对大家有所帮助。 这次,依然是使用的sklearn中的iris数据集,对其进行通过热图来展示。 预处理 sklearn.preprocessing是机器学习库中预处理的模块,
阅读全文
摘要:在这篇博客中,用一个小栗子来介绍一下散点图在多变量数据中的一方面应用。 scikit库中提供了一些数据,这里使用iris数据集,是一种鸢尾属植物,所给数据中包括两种类型的花,目的是根据所给信息判断两种花分别属于哪一类。也就是说找到区分这两种花的方法。 加载库 1 from sklearn.datas
阅读全文
摘要:单变量:表达式、方程式、函数或者一元多项式等 数据:http://www.presidency.ucsb.edu/data/sourequests.php美国总统历年在国情咨文中对国会提起的诉求数量 一、获取数据 本次使用到的数据量并不多,不过还是按照常规思路,通过爬虫获取。 1 import ur
阅读全文