[2] day 02

1. df.memory_usage()将返回每列占用多少

要包含索引,请传递index=True
所以要获得整体内存消耗:

2. numpy.iinfo

3. shift函数

https://blog.csdn.net/qq_18433441/article/details/56665931

axis=1,左右平移

4. np.where

 

5. expm1(x) := exp(x) - 1

6. df.isnull().values.any()

df.isnull().any() 按照每列判断,列中含有Ture则返回ture,列中全为False则返回False。即:会判断哪些”列”存在缺失值

any()作用:对每列,取或操作。False|Ture=Ture

all()作用:对每列,取与操作。False|Ture=False

7. train_df[columns_to_use].values

 type(train_df[columns_to_use])     为pandas.core.frame.DataFrame

type(train_df[columns_to_use].values)  为numpy.ndarray

8. train_df[columns_to_use].values.flatten()

 flatten() 返回一个折叠成 一维 的数组。但是该函数只能适用于numpy对象,即array或者mat,普通的list列表是不行的。

9. np.nonzero 返回非0值的下标

 

posted @ 2018-12-14 23:04  GuoXinxin  阅读(122)  评论(0编辑  收藏  举报