摘要: 采用DataFrame自带的values函数。去除DataFrame数据结构中的标签。 返回numpy。 阅读全文
posted @ 2021-07-27 22:11 祥瑞哈哈哈 阅读(462) 评论(0) 推荐(0) 编辑
摘要: pd.get_dummy把离散变量创建为新特征。相当于把特征值变为特征用0和1表示该实体是否具有。dummy_na=True表示增加一列Nan用来表示哪个个体缺失数据。 阅读全文
posted @ 2021-07-27 22:06 祥瑞哈哈哈 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 表达函数的简单方法。 实例: x=lambda a,b:a*b 执行结果 阅读全文
posted @ 2021-07-27 21:30 祥瑞哈哈哈 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 可以使用DataFrame.apply可以对某行或某列进行函数操作,返回一个DataFrame数据结构。 阅读全文
posted @ 2021-07-27 21:24 祥瑞哈哈哈 阅读(361) 评论(0) 推荐(0) 编辑
摘要: numeric_feaures=all_features.dtype[all_features.dtype!='object'].index 分部解析: all_features.dtypes:返回每个列数值类型。 all_features.dtypes !='object':返回每个列的布尔值,类 阅读全文
posted @ 2021-07-27 21:09 祥瑞哈哈哈 阅读(1439) 评论(0) 推荐(0) 编辑
摘要: 返回DataFrame每列的数值类型。 阅读全文
posted @ 2021-07-27 20:58 祥瑞哈哈哈 阅读(205) 评论(0) 推荐(0) 编辑
摘要: pandas.DataFrame.fillna 就是给Nan值填充数据的。把NAN值用0替换。 阅读全文
posted @ 2021-07-27 20:05 祥瑞哈哈哈 阅读(97) 评论(0) 推荐(0) 编辑
摘要: DataFrame.iloc选择DataFrame数据结构的行和列。 DataFrame.iloc[0:2,0:3]; 表示该数据结构0:2,0-2行; 表示该数据结构0:3,0-3列; 因此读取数据结构的0-2行已经0-3列。 通过该函数对数据进行切片。python3的切片方法不适用于datafr 阅读全文
posted @ 2021-07-27 19:32 祥瑞哈哈哈 阅读(415) 评论(0) 推荐(0) 编辑
摘要: 该函数返回一个表格型的数据结构,有行索引和列索引。 用printf可以将返回值内容全部输出。 除了最左边的列,其余的列均是从csv文档里读取。 阅读全文
posted @ 2021-07-27 19:17 祥瑞哈哈哈 阅读(2268) 评论(0) 推荐(0) 编辑
摘要: 首先打开Anaconda promt输入代码activate 环境名//确定要接收包的环境。 接下来输入conda install pandas 阅读全文
posted @ 2021-07-27 19:04 祥瑞哈哈哈 阅读(3015) 评论(0) 推荐(0) 编辑