上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 48 下一页
摘要: 获取series中给定索引的元素(items) ser = pd.Series(list('abcdefghijklmnopqrstuvwxyz')) index = [0, 4, 8, 14, 20] # 获取指定索引的元素 ser.take(index) #> 0 a 4 e 8 i 14 o 阅读全文
posted @ 2021-12-14 11:24 青竹之下 阅读(52) 评论(0) 推荐(0) 编辑
摘要: 如何获得数值series的四分位值 \# 设置随机数种子 state = np.random.RandomState(100) \# 从均值为5标准差为25的正态分布随机抽取5个点构成series ser = pd.Series(state.normal(10, 5, 25)) \# 求ser的四分 阅读全文
posted @ 2021-12-14 11:19 青竹之下 阅读(42) 评论(0) 推荐(0) 编辑
摘要: 如何结合多个series组成dataframe # 构建series1 ser1 = pd.Series(list('abcedfghijklmnopqrstuvwxyz')) # 构建series2 ser2 = pd.Series(np.arange(26)) # 方法1,axis=1表示列拼接 阅读全文
posted @ 2021-12-14 11:14 青竹之下 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 如何从列表,数组,字典构建series mylist = list('abcedfghijklmnopqrstuvwxyz') # 列表 myarr = np.arange(26) # 数组 mydict = dict(zip(mylist, myarr)) # 字典 # 构建方法 ser1 = p 阅读全文
posted @ 2021-12-14 11:12 青竹之下 阅读(31) 评论(0) 推荐(0) 编辑
摘要: Pandas 应用 Pandas 的主要数据结构是 Series (一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。 数据结构 Series 是一种类似于一维数组的对象,它由一组数据(各种Numpy数据类型)以及一组与之相关的数 阅读全文
posted @ 2021-12-14 11:06 青竹之下 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 什么是标准差? 标准差(Standard Deviation,又常称均方差)是一个数字,描述值的离散程度。 低标准偏差表示大多数数字接近均值(平均值)。 高标准偏差表示这些值分布在更宽的范围内。 例如:这次我们已经登记了 7 辆车的速度: speed = [86,87,88,86,87,85,86] 阅读全文
posted @ 2021-12-13 22:39 青竹之下 阅读(257) 评论(0) 推荐(0) 编辑
摘要: 我们已经知道,可以直接作用于for循环的数据类型有以下几种: 一类是集合数据类型,如list、tuple、dict、set、str等; 一类是generator,包括生成器和带yield的generator function。 这些可以直接作用于for循环的对象统称为可迭代对象:Iterable。 阅读全文
posted @ 2021-12-12 21:56 青竹之下 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 决策树(Decision Tree) 在本章中,我们将向您展示如何制作“决策树”。决策树是一种流程图,可以帮助您根据以前的经验进行决策。 在这个例子中,一个人将尝试决定他/她是否应该参加喜剧节目。 幸运的是,我们的例中人物每次在镇上举办喜剧节目时都进行注册,并注册一些关于喜剧演员的信息,并且还登记了 阅读全文
posted @ 2021-12-11 22:56 青竹之下 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 评估模型 在机器学习中,我们创建模型来预测某些事件的结果,就像在上一章中当我们了解重量和发动机排量时,预测了汽车的二氧化碳排放量一样。 要衡量模型是否足够好,我们可以使用一种称为训练/测试的方法。 什么是训练/测试 训练/测试是一种测量模型准确性的方法。 之所以称为训练/测试,是因为我们将数据集分为 阅读全文
posted @ 2021-12-11 22:51 青竹之下 阅读(140) 评论(0) 推荐(0) 编辑
摘要: 数据分布(Data Distribution) 在本教程稍早之前,我们仅在例子中使用了非常少量的数据,目的是为了了解不同的概念。 在现实世界中,数据集要大得多,但是至少在项目的早期阶段,很难收集现实世界的数据。 我们如何获得大数据集? 为了创建用于测试的大数据集,我们使用 Python 模块 Num 阅读全文
posted @ 2021-12-11 22:45 青竹之下 阅读(236) 评论(0) 推荐(0) 编辑
上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 48 下一页