摘要:
查看所有单元格是否为NaN DataFrame.isnull() 这个函数会返回一个和原来表格大小相同的表格,原表格值为NaN,此表中为True,否则为False pandas.notnull() 结果恰好是上一个表格的取反 用DataFrame.dropna(axis=0, how='any', 阅读全文
摘要:
Series(列)方法describe(),对于不同类型的变量的列,有不同返回值(http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.describe.html) 列方法Series.value_counts( 阅读全文
摘要:
当DataFrame中的元素可以根据某一列来分组时,比如各个国家的经济数据根据各个国家所在的大陆分成几组 第一行得到的是各个大陆GDP的均值,第二行得到的是整个表格中数字列的(各大陆的)均值。 mean()也可以换成别的函数,agg()可以一次进行多个统计值的计算 阅读全文
摘要:
一般语法格式Series.str.method()。具体方法见http://pandas.pydata.org/pandas-docs/stable/api.html#string-handling 例如 作用:Convert strings in the Series/Index to be ca 阅读全文
摘要:
axis=1表示列(1是竖着的),axis=0表示行 在mean()方法中有所不同,mean(axis=0)返回的是各列的平均值 运行结果是 可以理解为对各列的所有行做平均。 阅读全文
摘要:
通过tushare引入DataFrame 阅读全文
摘要:
数据来源见前边的几篇随笔 对其中的一列排序 可以看到返回的是一个Series 我们也可以对整个DataFrame进行排序 优先按high排序,high有相同的,按lower排序 阅读全文
摘要:
同样,引入一个DataFrame 然后使用drop()函数,删除了换手率‘turnover’列,如下: 如需删除多列,可以将data.drop('turnover', axis=1, inplace=True)中的‘turnover’,改成一个需要删除列(列名的)字符串list。 删除行 list内 阅读全文
摘要:
同样从tushare平台搞到一个DataFrame表格,用data.columns查看列名 显示如下: 使用DataFrame自带的rename方法改变列名,语法格式和结果如下: 可以看到open被open_price代替了,如果想改变多个列名,可以直接将一个包涵各个列名的list复制给data.c 阅读全文
摘要:
从tushare平台获取一个股票的DataFrame格式的数据 这里的d和data都是DataFrame格式,具体如下: 如果要选择其中一列(Series)如open这一列,有两种写法data.open或者data['open'],通过print()打印结果如下: 用type(data.open)或 阅读全文