09 2017 档案
摘要:学习如何使用置信区间估计总体参数,并估计某种处理的效果。 总结下上一章的内容,我们从一个总体(分布) 即 Klout 分数开始介绍,该总体的数量是 1,048,Klout 分数均值是 37.72,总体标准偏差约为 16.04,根据中心极限定理,如果我们取出同一样本量的所有可能样本,然后算出每个样本的
阅读全文
摘要:如果给出正态分布总体的均值和标准偏差,我们就能通过计算出小于或大于任何值的百分比,将该值与总体中剩余的值对比,那对于样本呢,我们如何将总体中的特定样本与其他样本相比较? 所有选项都正,之前我们已经了解到中心值可以描述一组数据,如果我们要对比样本,我们可以对比该样本的中心值具体来说即均值。 举一个简单
阅读全文
摘要:概率密度函数 在正态分布中,通过查看某个值在 x 轴上的位置,即标准偏差,我们能够确定小于或大于任何值的百分比,接下来将学习如何计算这些百分比。请注意,我们使用的是理论曲线来绘制数据模型,该曲线下的面积是 1,因为它是用分布数据的相对频率(即比例)来绘制数据模型,该曲线叫做概率密度函数,通常缩写为
阅读全文
摘要:之前已经看到了用直方图来显示数据集的重要性,以便分析图表形状,我们想要分析该形状,这样就可以严谨地思考平均值、中位数和众数并描述数据集,在偏态分布中平均值、中位数和众数各不相同,在很多情况下,中位数可能比平均值更有用,在正态分布中,平均值、中位数和众数几乎相等,还需要了解分布形状的哪些方面? 举例说
阅读全文
摘要:学习如何使用方差和标准偏差定量分析数据的分布。并学习如何使用箱线图和四分位距找出差异值。 值域 平均值、中位数和众数似乎是一样的 众数 图1,众数是y轴值为330的那一列,对应的x轴的值为40000-50000;图2,众数是y轴值为187的那一列,对应的x轴的值为40000-50000 中位数 样本
阅读全文
摘要:学习集中趋势的三种量度:均值、中位数和众数。 用这些分布来判断,看起来大多数护理专业学生每年能挣50,000到60,000之间,所以,如果说出这两个数字之间的数字,那么就没错,但对于大多数地理专业学生来说,应该在40,000到可能55,000之间,我们关注分布的中心,这是大多数得分所在的位置,这个中
阅读全文
摘要:通过创建和解读直方图、柱状图和频数图,学习数据可视化基础知识。 大多数学员都来自中国,但是只花 4 秒钟的时间来观察这一表格可能很难看出,你可能扫了一眼表格,发现上面写了好多“中国”,因此能够感觉到哪个国家出现的概率最高,你的大脑可以自动这么思考,但是对于统计学,我们需要用简单的方式规范化这一流程,
阅读全文
摘要:学习构建(Constructs,有时也叫抽象概念)、总体与样本、相关与因果、假设以及试验。 构建 例:假如你明天有一场大考,你要尽力保证自己记忆力清晰,你会做什么准备呢?假如我们采访一批受访者,42% 的受访者会在考试前一晚努力健身,28% 回应要好好吃一顿,16% 会通宵达旦地学习,13% 要睡个
阅读全文
摘要:初识机器学习 机器学习主要源于2个领域:人工智能和数据科学。 人工智能 人工智能是创造出与人类一样聪明的机器,在这个方向上,该领域又分为不同的学派,包括关注构建像人类一样思考的认知系统。 人工智能(AI)的难题: 1.所有的智能体都只有很少的计算资源、很低的处理速度和很小的内存等等。2.所有的计算都
阅读全文