摘要:
采用DataFrame自带的values函数。去除DataFrame数据结构中的标签。 返回numpy。 阅读全文
摘要:
pd.get_dummy把离散变量创建为新特征。相当于把特征值变为特征用0和1表示该实体是否具有。dummy_na=True表示增加一列Nan用来表示哪个个体缺失数据。 阅读全文
摘要:
表达函数的简单方法。 实例: x=lambda a,b:a*b 执行结果 阅读全文
摘要:
可以使用DataFrame.apply可以对某行或某列进行函数操作,返回一个DataFrame数据结构。 阅读全文
摘要:
numeric_feaures=all_features.dtype[all_features.dtype!='object'].index 分部解析: all_features.dtypes:返回每个列数值类型。 all_features.dtypes !='object':返回每个列的布尔值,类 阅读全文
摘要:
返回DataFrame每列的数值类型。 阅读全文
摘要:
pandas.DataFrame.fillna 就是给Nan值填充数据的。把NAN值用0替换。 阅读全文
摘要:
DataFrame.iloc选择DataFrame数据结构的行和列。 DataFrame.iloc[0:2,0:3]; 表示该数据结构0:2,0-2行; 表示该数据结构0:3,0-3列; 因此读取数据结构的0-2行已经0-3列。 通过该函数对数据进行切片。python3的切片方法不适用于datafr 阅读全文
摘要:
该函数返回一个表格型的数据结构,有行索引和列索引。 用printf可以将返回值内容全部输出。 除了最左边的列,其余的列均是从csv文档里读取。 阅读全文
摘要:
首先打开Anaconda promt输入代码activate 环境名//确定要接收包的环境。 接下来输入conda install pandas 阅读全文