上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 27 下一页
摘要: Pandas数据结构 Pandas中一共有三种数据结构,分别为:Series、DataFrame和MultiIndex(老版本中叫Panel )。 其中Series是一维数据结构,DataFrame是二维的表格型数据结构,MultiIndex是三维的数据结构。 1.Series Series是一个类 阅读全文
posted @ 2021-01-27 18:33 ziyuliu 阅读(125) 评论(0) 推荐(0) 编辑
摘要: 应用groupby和聚合函数实现数据的分组与聚合 什么分组与聚合 分组API DataFrame.groupby(key, as_index=False) key:分组的列数据,可以多个 案例:不同颜色的不同笔的价格数据 col =pd.DataFrame({'color': ['white','r 阅读全文
posted @ 2021-01-26 21:32 ziyuliu 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 机器学习定义: We define machine learning as a set of methods that can automatically detect patterns in data, and then use the uncovered patterns to predict 阅读全文
posted @ 2021-01-26 18:20 ziyuliu 阅读(140) 评论(0) 推荐(0) 编辑
摘要: 交叉表与透视表什么作用 交叉表:交叉表用于计算一列数据对于另外一列数据的分组个数(用于统计分组频率的特殊透视表) pd.crosstab(value1, value2) 透视表:透视表是将原有的DataFrame的列分别作为行索引和列索引,然后对指定的列应用聚集函数 data.pivot_table 阅读全文
posted @ 2021-01-25 21:31 ziyuliu 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 架构是系统设计的一部分,它突出了某些细节,并通过抽象省略掉了另一些细节。软件系统的架构包括行为上的和结构上的。外部行为描述展示了软件如何与用户、其他设备和外部设备进行交互,也就是需求。结构描述展示了软件如何被划分为多个部分,以及这些部分的关系。 2.架构设计目标 架构设计目标即另外一个需求,对其他开 阅读全文
posted @ 2021-01-24 21:40 ziyuliu 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 为什么要离散化 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具。 什么是数据的离散化 连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值。 离散化有很多 阅读全文
posted @ 2021-01-24 21:30 ziyuliu 阅读(144) 评论(0) 推荐(0) 编辑
摘要: 类似 如何处理nan 判断数据中是否包含NaN: pd.isnull(df) pd.notnull(df) import pandas as pdimport numpy as npimport matplotlib.pyplot as plt movie = pd.read_csv("./data 阅读全文
posted @ 2021-01-23 20:58 ziyuliu 阅读(134) 评论(0) 推荐(0) 编辑
摘要: Numpy介绍 Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度的数组。 Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python要简洁的多。 Numpy使用ndarray对象来处理多维数组,该对象是一个快 阅读全文
posted @ 2021-01-22 17:35 ziyuliu 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 特征提取 1 将任意数据(如文本或图像)转换为可用于机器学习的数字特征 注:特征值化是为了计算机更好的去理解数据 字典特征提取(特征离散化) 文本特征提取 图像特征提取(深度学习将介绍) 2 特征提取API sklearn.feature_extraction 字典特征提取 作用:对字典数据进行特征 阅读全文
posted @ 2021-01-22 16:48 ziyuliu 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 画出某城市11点到12点1小时内每分钟的温度变化折线图,温度范围在15度~18度 import matplotlib.pyplot as plt import random # 画出温度变化图 # 0.准备x, y坐标的数据 x = range(60) y_shanghai = [random.un 阅读全文
posted @ 2021-01-21 17:43 ziyuliu 阅读(148) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 27 下一页