随笔分类 -  Udacity机器学习入门之统计基础(一)

摘要:了解什么是有效大小,尝试一个单一样本t检验的完整示例。 效应量 调查研究的一个重要方面是效应量,在实验性研究中或存在处理变量的研究中,效应量是指处理效应的大小,意思很直观; 在非实验性研究中,效应量是指变量之间的关系强度,在 z 检验或 t 检验中,最简单的效应量衡量指标是均值差异,即两个均值之间的 阅读全文
posted @ 2017-10-17 14:51 扎心了,老铁 阅读(3240) 评论(0) 推荐(0) 编辑
摘要:介绍T分布、T检验、Z检验与T检验、P值、相依样本以及配对样本的非独立T检验。 T分布 在到目前为止举的所有例子中,我们都假设我们知道总体参数 μ 和 σ,但很多时候,我们并不知道,我们通常只有样本,然后只能通过样本得出所有结论。 通过样本得出样本均值与总体的区别有多大?以及两个样本之间区别多大? 阅读全文
posted @ 2017-10-13 14:43 扎心了,老铁 阅读(3606) 评论(1) 推荐(0) 编辑
摘要:学习假设检验的基础知识,包括如何设置假设检验。 统计学家规定了关于可能性或不可能性的三个常规级别:如果达到样本均值的概率小于,0.05 即 5%,0.01 即 1% 或 0.001 即 0.1%,那么通常被视为不太可能发生。概率小于 0.1% 的情况是非常不可能的,这些叫做 α 水平。 现在做一道快 阅读全文
posted @ 2017-10-11 14:52 扎心了,老铁 阅读(15343) 评论(1) 推荐(0) 编辑
摘要:学习如何使用置信区间估计总体参数,并估计某种处理的效果。 总结下上一章的内容,我们从一个总体(分布) 即 Klout 分数开始介绍,该总体的数量是 1,048,Klout 分数均值是 37.72,总体标准偏差约为 16.04,根据中心极限定理,如果我们取出同一样本量的所有可能样本,然后算出每个样本的 阅读全文
posted @ 2017-09-28 10:25 扎心了,老铁 阅读(1103) 评论(2) 推荐(0) 编辑
摘要:如果给出正态分布总体的均值和标准偏差,我们就能通过计算出小于或大于任何值的百分比,将该值与总体中剩余的值对比,那对于样本呢,我们如何将总体中的特定样本与其他样本相比较? 所有选项都正,之前我们已经了解到中心值可以描述一组数据,如果我们要对比样本,我们可以对比该样本的中心值具体来说即均值。 举一个简单 阅读全文
posted @ 2017-09-27 10:17 扎心了,老铁 阅读(3730) 评论(1) 推荐(0) 编辑
摘要:概率密度函数 在正态分布中,通过查看某个值在 x 轴上的位置,即标准偏差,我们能够确定小于或大于任何值的百分比,接下来将学习如何计算这些百分比。请注意,我们使用的是理论曲线来绘制数据模型,该曲线下的面积是 1,因为它是用分布数据的相对频率(即比例)来绘制数据模型,该曲线叫做概率密度函数,通常缩写为 阅读全文
posted @ 2017-09-27 08:58 扎心了,老铁 阅读(2066) 评论(1) 推荐(0) 编辑
摘要:之前已经看到了用直方图来显示数据集的重要性,以便分析图表形状,我们想要分析该形状,这样就可以严谨地思考平均值、中位数和众数并描述数据集,在偏态分布中平均值、中位数和众数各不相同,在很多情况下,中位数可能比平均值更有用,在正态分布中,平均值、中位数和众数几乎相等,还需要了解分布形状的哪些方面? 举例说 阅读全文
posted @ 2017-09-27 08:22 扎心了,老铁 阅读(13180) 评论(2) 推荐(2) 编辑
摘要:学习如何使用方差和标准偏差定量分析数据的分布。并学习如何使用箱线图和四分位距找出差异值。 值域 平均值、中位数和众数似乎是一样的 众数 图1,众数是y轴值为330的那一列,对应的x轴的值为40000-50000;图2,众数是y轴值为187的那一列,对应的x轴的值为40000-50000 中位数 样本 阅读全文
posted @ 2017-09-25 16:21 扎心了,老铁 阅读(1529) 评论(0) 推荐(0) 编辑
摘要:学习集中趋势的三种量度:均值、中位数和众数。 用这些分布来判断,看起来大多数护理专业学生每年能挣50,000到60,000之间,所以,如果说出这两个数字之间的数字,那么就没错,但对于大多数地理专业学生来说,应该在40,000到可能55,000之间,我们关注分布的中心,这是大多数得分所在的位置,这个中 阅读全文
posted @ 2017-09-18 14:01 扎心了,老铁 阅读(1249) 评论(0) 推荐(0) 编辑
摘要:通过创建和解读直方图、柱状图和频数图,学习数据可视化基础知识。 大多数学员都来自中国,但是只花 4 秒钟的时间来观察这一表格可能很难看出,你可能扫了一眼表格,发现上面写了好多“中国”,因此能够感觉到哪个国家出现的概率最高,你的大脑可以自动这么思考,但是对于统计学,我们需要用简单的方式规范化这一流程, 阅读全文
posted @ 2017-09-15 09:23 扎心了,老铁 阅读(1074) 评论(1) 推荐(0) 编辑
摘要:学习构建(Constructs,有时也叫抽象概念)、总体与样本、相关与因果、假设以及试验。 构建 例:假如你明天有一场大考,你要尽力保证自己记忆力清晰,你会做什么准备呢?假如我们采访一批受访者,42% 的受访者会在考试前一晚努力健身,28% 回应要好好吃一顿,16% 会通宵达旦地学习,13% 要睡个 阅读全文
posted @ 2017-09-14 09:11 扎心了,老铁 阅读(1639) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示