上一页 1 ··· 6 7 8 9 10 11 下一页
摘要: 查看所有单元格是否为NaN DataFrame.isnull() 这个函数会返回一个和原来表格大小相同的表格,原表格值为NaN,此表中为True,否则为False pandas.notnull() 结果恰好是上一个表格的取反 用DataFrame.dropna(axis=0, how='any',  阅读全文
posted @ 2017-09-07 13:46 imageSet 阅读(250) 评论(0) 推荐(0) 编辑
摘要: Series(列)方法describe(),对于不同类型的变量的列,有不同返回值(http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.describe.html) 列方法Series.value_counts( 阅读全文
posted @ 2017-09-06 22:32 imageSet 阅读(367) 评论(0) 推荐(0) 编辑
摘要: 当DataFrame中的元素可以根据某一列来分组时,比如各个国家的经济数据根据各个国家所在的大陆分成几组 第一行得到的是各个大陆GDP的均值,第二行得到的是整个表格中数字列的(各大陆的)均值。 mean()也可以换成别的函数,agg()可以一次进行多个统计值的计算 阅读全文
posted @ 2017-09-06 20:37 imageSet 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 一般语法格式Series.str.method()。具体方法见http://pandas.pydata.org/pandas-docs/stable/api.html#string-handling 例如 作用:Convert strings in the Series/Index to be ca 阅读全文
posted @ 2017-09-06 15:00 imageSet 阅读(801) 评论(0) 推荐(0) 编辑
摘要: axis=1表示列(1是竖着的),axis=0表示行 在mean()方法中有所不同,mean(axis=0)返回的是各列的平均值 运行结果是 可以理解为对各列的所有行做平均。 阅读全文
posted @ 2017-09-06 14:35 imageSet 阅读(524) 评论(0) 推荐(0) 编辑
摘要: 通过tushare引入DataFrame 阅读全文
posted @ 2017-09-05 21:33 imageSet 阅读(542) 评论(0) 推荐(0) 编辑
摘要: 数据来源见前边的几篇随笔 对其中的一列排序 可以看到返回的是一个Series 我们也可以对整个DataFrame进行排序 优先按high排序,high有相同的,按lower排序 阅读全文
posted @ 2017-09-05 20:42 imageSet 阅读(400) 评论(0) 推荐(0) 编辑
摘要: 同样,引入一个DataFrame 然后使用drop()函数,删除了换手率‘turnover’列,如下: 如需删除多列,可以将data.drop('turnover', axis=1, inplace=True)中的‘turnover’,改成一个需要删除列(列名的)字符串list。 删除行 list内 阅读全文
posted @ 2017-09-05 20:07 imageSet 阅读(1122) 评论(0) 推荐(0) 编辑
摘要: 同样从tushare平台搞到一个DataFrame表格,用data.columns查看列名 显示如下: 使用DataFrame自带的rename方法改变列名,语法格式和结果如下: 可以看到open被open_price代替了,如果想改变多个列名,可以直接将一个包涵各个列名的list复制给data.c 阅读全文
posted @ 2017-09-05 19:41 imageSet 阅读(575) 评论(0) 推荐(0) 编辑
摘要: 从tushare平台获取一个股票的DataFrame格式的数据 这里的d和data都是DataFrame格式,具体如下: 如果要选择其中一列(Series)如open这一列,有两种写法data.open或者data['open'],通过print()打印结果如下: 用type(data.open)或 阅读全文
posted @ 2017-09-05 18:29 imageSet 阅读(441) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 下一页