摘要: 今天使用happybase 在Windows端读取hbase 的时候,提示“ ThriftPy does not support generating module with path in protocol 'c'” 错误,查询相关的资料:https://github.com/eleme/thri 阅读全文
posted @ 2017-09-12 15:42 angelxp 阅读(2500) 评论(1) 推荐(0) 编辑
摘要: 在日常我们获取的数据中,经常会出现数据缺失的情况。对数据缺失的处理,有多种处理的方法:插值填补、平均值填补方法很多。这里不具体讨论用哪种方式去插补这些数据,而只是谈谈如何使用pandas去快速的处理这些数据。 pandas 常用np.nan代表缺失数据,详情可以查看Missing Data sect 阅读全文
posted @ 2017-07-06 23:30 angelxp 阅读(411) 评论(0) 推荐(0) 编辑
摘要: 本文接续注释版1,前文重点讲述了如何创建一个panads对象,本文重点讲述如何查看这些已经创建的对象。 【查看数据】 See the top & bottom rows of the frame(查看frame头部和尾部的行) 上面为完成的series,可以看到定义了一个10000个值,现在我们只取 阅读全文
posted @ 2017-07-01 18:54 angelxp 阅读(960) 评论(0) 推荐(0) 编辑
摘要: 接触Pandas有一段时间,但一直未能系统的进行过总结。最近开始接触机器学习,用pandas的地方颇多,因此专门重新整理以下。 首先,Pandas 作为Python处理矩阵类数据的王牌利器,其官方文档相当丰富而且详细,为了方便学习Pandas官方竟然给了一个10min中的入门教程,链接如下:http 阅读全文
posted @ 2017-06-28 00:07 angelxp 阅读(1506) 评论(0) 推荐(0) 编辑