上一页 1 2 3 4 5 6 7 8 9 10 ··· 34 下一页
摘要: 根节点 非叶子节点(决策点) 叶子节点(决策结果) 分支 熵代表混乱程度 信息增益 构造树的基本想法是随着树深度的增加、节点的熵迅速地降低。熵降低的速度越快越好,这样我们有望得到一颗高度最矮的决策树 信息增溢值越大越好 谁当根节点? 信息增益率 重要: 阅读全文
posted @ 2019-11-19 11:20 foremost 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 1、基本概念 在数据分析工作中,Pandas 的使用频率是很高的,一方面是因为 Pandas 提供的基础数据结构 DataFrame 与 json 的契合度很高,转换起来就很方便。另一方面,如果我们日常的数据清理工作不是很复杂的话,你通常用几句 Pandas 代码就可以对数据进行规整。 阅读全文
posted @ 2019-11-17 19:48 foremost 阅读(722) 评论(0) 推荐(0) 编辑
摘要: 一、numpy 用NumPy快速处理数据 NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含: 矩阵运算 jupyter快捷键 1、ndarray 对象 ndarray 实际上是多维数组的含义。在 NumPy 数组中,维数称为秩(rank),一维数组 的秩为 1,二维数组的秩为 2,以 阅读全文
posted @ 2019-11-17 13:51 foremost 阅读(1582) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 获取数据的方式: 企业生产的用户数据 数据管理咨询公司 政府/机构提供的公开数据 第三方数据平台购买数据 爬虫爬取数据 requests模块 resp.text返回的是Unicode型的数据。 resp.content返回的是bytes型也就是二进制的数据。 也就是说,如果你想取文本, 阅读全文
posted @ 2019-11-12 10:59 foremost 阅读(247) 评论(0) 推荐(0) 编辑
摘要: python 文件处理 li = [['语文','数学','英语'],['100','122','123']] for i in li: print(','.join(i)) # join字符串拼接 语文,数学,英语 100,122,123 从原文件末尾开始写入 # 方法一 with open('u 阅读全文
posted @ 2019-11-07 21:28 foremost 阅读(308) 评论(0) 推荐(0) 编辑
摘要: 数据分析全景图 1. 数据采集。它是我们的原材料,也是最“接地气”的部分,因为任何分析都要有数据源。 2. 数据挖掘。它可以说是最“高大上”的部分,也是整个商业价值所在。之所以要进行数据分析,就是要找到其中的规律,来指导我们的业务。因此数据挖掘的核心是挖掘数据的商业价值,也就是我们所谈的商业智能 B 阅读全文
posted @ 2019-11-05 10:43 foremost 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 1、函数介绍 Python 函数介绍 2、变量的作用域 3、递归函数 作业 递归函数求10! 匿名函数 Python3 函数进阶&迭代器与生成器 列表生成器 例题:求100以内3的倍数 python的各种推导式(列表推导式、字典推导式、集合推导式) 4、高阶函数 reduce() 累计求和 例如 1 阅读全文
posted @ 2019-11-04 20:55 foremost 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 1、python的特点 2、python常见函数 3、python变量 4、python数据结构 Python的数据缓存机制探究 5、is和==区别 数据类型整理 字符串、列表、字典、集合 字符串在格式化 python算术运算符 Python高阶函数(Map、Reduce、Filter)和lambd 阅读全文
posted @ 2019-10-29 19:38 foremost 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 排列数: 组合数: 关联规则: 1、联合概率和条件概率 联合概率:P(AB)两个概率同时发生的概率 2、关联规则算法 数据分析精选 这个发现为商家带来了大量的利润,但是如何从浩如烟海却又杂乱无章的大数据中,发现啤酒和尿布销售之间的联系呢?这又给了我们什么样的启示呢?关联规则分析 关联规则挖掘的一个典 阅读全文
posted @ 2019-10-01 20:26 foremost 阅读(761) 评论(0) 推荐(0) 编辑
摘要: 1、函数的引入 函数的三要数:定义域、值域、对应的映射法则 函数的特性:有界性、单调性、奇偶性、周期性 近似计算,泰勒展开 2、反函数 2、两个重要极限 3、导数公式与基本求导法则 4、方向导数和梯度下降 最小二乘法: 最小二乘法公式是一个数学的公式,在数学上称为曲线拟合,此处所讲最小二乘法,专指线 阅读全文
posted @ 2019-09-23 22:38 foremost 阅读(354) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 34 下一页