摘要: 机器学习目录 文档: pandas数据结构 机器学习算法 网盘链接(huaw) 一 Pandas常用知识点 1 pandas(一) 2 pandas(二) 3 数据提取:iloc与loc 4 数据合并 5 数据聚合与数据透视 二 机器学习常用算法 0 概述-数据集-特征工程 1 分类算法 1、skl 阅读全文
posted @ 2021-06-25 20:57 风hua 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 5 数据聚合与数据透视 ① 数据聚合 一.定义 通过不同变量对大型数据帧进行分组,以及对每个组应用汇总函数的任务。这时需在pandas中使用DataFrame对象的groupby函数和 agg函数完成。 二.导入实验数据集 三.数据集字段释义 phone.csv数据集包含830个记录共7个字段,以下 阅读全文
posted @ 2021-06-25 20:55 风hua 阅读(224) 评论(0) 推荐(0) 编辑
摘要: 4 数据合并 ①concat 一.定义 concat函数可以在两个维度上对数据进行拼接,默认纵向拼接(axis=0),即按行拼接。拼接方式默认为外连接(outer),即取所有的表头字段或索引字段。 二.语法 pd.concat(objs,axis=0, join='outer', ignore_in 阅读全文
posted @ 2021-06-25 20:29 风hua 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 3 数据提取:iloc与loc 一、iloc 1.定义 iloc索引器用于按位置进行基于整数位置的索引或者选择 2.语法 df.iloc [row selection, column selection] 3.代码示例 (1)导入数据 (2)选择单行或单列 (2)选择多行或多列 (3)注意 iloc 阅读全文
posted @ 2021-06-25 20:10 风hua 阅读(442) 评论(0) 推荐(0) 编辑
摘要: Pandas(二) 1.定义 DataFrame为具有行和列的二维数据,具有大小可变的数据结构 2.手动创建DataFrame 3.将外部文件读取到DataFrame 4.查看DataFrame大小 5.预览DataFrame 6.查看所有列的数据类型 7.查看指定列的数据类型 8.更改列的数据类型 阅读全文
posted @ 2021-06-25 20:01 风hua 阅读(52) 评论(0) 推荐(0) 编辑
摘要: DataFrame 1.读入数据 2.获取前5行 3.获取第3-4行 4.获取特定的列 5.使用整数选择行和列 6.使用整数和标签的混合来选择行和列 7.获取这三列 8.重置索引为province 9.更改列名 10.对数据进行计算 11 根据increase字段降序 12.matplotlib作图 阅读全文
posted @ 2021-06-25 19:44 风hua 阅读(39) 评论(0) 推荐(0) 编辑