2016年3月22日

利用python进行数据分析之数据聚合和分组运算

摘要: 对数据集进行分组并对各分组应用函数是数据分析中的重要环节。 group by技术 pandas对象中的数据会根据你所提供的一个或多个键被拆分为多组,拆分操作是在对象的特定轴上执行的,然后将一个函数应用到各个分组并产生一个新值,最后所有这些函数的执行结果会被合并到最终的结果对象中。 无论你准准备拿gr 阅读全文

posted @ 2016-03-22 09:26 splended 阅读(71286) 评论(1) 推荐(1) 编辑

2016年3月16日

利用python进行数据分析之绘图和可视化

摘要: matplotlib API入门 使用matplotlib的办法最常用的方式是pylab的ipython,pylab模式还会向ipython引入一大堆模块和函数提供一种更接近与matlab的界面,matplotlib API函数位于matplotlib.pyplot模块中,其通常的引入约定是:imp 阅读全文

posted @ 2016-03-16 09:35 splended 阅读(40172) 评论(0) 推荐(0) 编辑

2016年2月25日

利用python进行数据分析之数据规整化

摘要: 数据分析和建模大部分时间都用在数据准备上,数据的准备过程包括:加载,清理,转换与重塑。 合并数据集 pandas对象中的数据可以通过一些内置方法来进行合并: pandas.merge可根据一个或多个键将不同DataFrame中的行连接起来,实现类似于数据库中的连接操作。 pandas.cancat表 阅读全文

posted @ 2016-02-25 10:01 splended 阅读(5400) 评论(0) 推荐(0) 编辑

2016年2月19日

利用python进行数据分析之pandas库的应用(二)

摘要: 本节介绍Series和DataFrame中的数据的基本手段 重新索引 pandas对象的一个重要方法就是reindex,作用是创建一个适应新索引的新对象 >>> from pandas import Series,DataFrame >>> obj=Series([4.5,7.2,-5.3,3.6] 阅读全文

posted @ 2016-02-19 16:48 splended 阅读(1834) 评论(0) 推荐(0) 编辑

2016年2月16日

利用python进行数据分析之pandas库的应用(一)

摘要: 一、pandas的数据结构介绍 Series Series是由一种类似于一维数组的对象,它由一组数据以及一组与之相关的数据索引构成。仅由一组数据可产生最简单的Series。 obj=Series([4,5,-7,6]) Series字符串表现形式为索引在左边,值在右边。 通过Series的index 阅读全文

posted @ 2016-02-16 14:41 splended 阅读(899) 评论(0) 推荐(0) 编辑

2016年2月15日

利用python进行数据分析之数据加载存储与文件格式

摘要: 在开始学习之前,我们需要安装pandas模块。由于我安装的python的版本是2.7,故我们在https://pypi.python.org/pypi/pandas/0.16.2/#downloads 此网站上下载的0.16.2版本,下载后解压缩利用dos命令打开对应的文件下,并运行 python 阅读全文

posted @ 2016-02-15 17:29 splended 阅读(8384) 评论(0) 推荐(0) 编辑

导航