摘要:【数据分析师 Level 1 】7.机器学习的基本概念 1.什么是机器学习 机器学习研究如何让计算机不需要明确的程序也能具备学习能力(——Arthur Samuel 1959) 一个计算机程序在完成了任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是以衡量的P,随着E的增加而增加,
阅读全文
摘要:【数据分析师 Level 1 】6.一元线性回归 1.相关关系 散点图的绘制与解读、相关系数的概念与特征 用于衡量两类现象在发展变化的方向与大小方面存在一定的关联(不包括因果和共变关系)。 正线性相关 例如销售额中涵盖了销售利润和各类成本等,从数据大致可以看出,销售利润随着销售额的增长而增长,由于各
阅读全文
摘要:1.方差分析 方差分析可以提高假设检验的效率,增加了分析的可靠性 方差分析的基本原理 指根据试验结果,鉴别各个有关因素对试验结果影响的有效方法。是方差的可加性原则 方差分析的基本假设 各个总体都应服从正态分布 各个总体的方差都必须相同 观察值是独立的 单因素方差分析 指将所获得的数据按某些项目分类后
阅读全文
摘要:假设检验 1.基本概念 假设检验的基本步骤(以两个总体均值的假设检验为例) (2)确定小概率事件的界值,一般情况下我们将p<0.05或p<0.01作为小概率的界值 (这里的0.05和0.01称为显著性水平) (3)获取样本,即随机抽样 (4)选择检验的方法,选择具体的检验统计量并计算 (5)确定P值
阅读全文
摘要:【数据分析师 Level 1 】3.抽样分布及参数估计 抽样分布及参数估计 1.随机的基本概念 随机实验 随机实验是概率论的一个基本概念。概括的讲,在概率论中把符合下面三个特点的试验叫做随机试验 可以在相同的条件下重复的进行 每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果 进行一次试验
阅读全文
摘要:Evernote Export 【数据分析师 Level 1 】2.描述性统计分析 描述性统计分析 数据的计量尺度和具体的统计方法息息相关,大致分为3类,分别是名义测量、次序测量和连续变量测量。这三类测量分别对应三种变量类型,即分类变量,顺序变量和数值变量。连续变量测量可以进一步细分为间距测量和比率
阅读全文
摘要:Evernote Export 数据分析师 Level 1 数据分析概述 数据分析和数据挖掘的概念 数据分析(Data Analysis) 是以数据为分析对象,以探索数据内的有用信息为主要途径,以解决业务需求为最终目标,包含业务理解、数据采集、数据清洗、数据探索、数据可视化、数据建模、模型结果可视化
阅读全文