摘要:
Python 和 Pandas 数据分析教程 原文:Data Analysis with Python and Pandas Tutorial Introduction 译者:飞龙 协议:CC BY-NC-SA 4.0 大家好,欢迎阅读 Python 和 Pandas 数据分析系列教程。 Panda 阅读全文
摘要:
面向(未来的)数据科学家的入门课来咯~ 前一半讲 Python 编程,后一半讲统计学基本概念并用 Python 模拟。 Github:https://github.com/Kivy-CN/data8-textbook-zh Gitee:https://gitee.com/wizardforcel/d 阅读全文
摘要:
十五、分类 原文:Classification 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 David Wagner 是这一章的主要作者。 机器学习是一类技术,用于自动寻找数据中的规律,并使用它来推断或预测。你已经看到了线性回归,这是一种机器学习技术。本章介绍一个新的技术: 阅读全文
摘要:
十三、预测 原文:Prediction 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 数据科学的一个重要方面,是发现数据可以告诉我们什么未来的事情。气候和污染的数据说了几十年内温度的什么事情?根据一个人的互联网个人信息,哪些网站可能会让他感兴趣?病人的病史如何用来判断他或她对 阅读全文
摘要:
十二、为什么均值重要 原文:Why the Mean Matters 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 在这个课程中,我们已经研究了几个不同的统计量,包括总编译距离,最大值,中位数和平均值。在关于随机性的明确假设下,我们绘制了所有这些统计量的经验分布。有些统计量, 阅读全文
摘要:
十四、回归的推断 原文:Inference for Regression 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 到目前为止,我们对变量之间关系的分析纯粹是描述性的。我们知道如何找到穿过散点图的最佳直线来绘制。在所有直线中它的估计的均方误差最小,从这个角度来看,这条线是 阅读全文
摘要:
十一、估计 原文:Estimation 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 在前一章中,我们开始开发推断思维的方法。特别是,我们学会了如何使用数据,在世界的两个假设之间做决策。但是我们通常只想知道,某件事情有多大。 例如,在前面的章节中,我们调查了敌人可能拥有的战机 阅读全文
摘要:
十七、更新预测 原文:Updating Predictions 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 我们知道如何使用训练数据将一个点划分为两类之一。 我们的分类只是对类别的预测,基于最接近我们的新点的,训练点中最常见的类别。 假设我们最终发现了我们的新点的真实类别。 阅读全文
摘要:
二、因果和实验 原文:Causality and Experiments 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 “这些问题已经,而且可能永远留在自然界难以捉摸的秘密之中,它们属于人类智力根本难以接近的一类问题。 - 1849 年 9 月,伦敦时报,霍乱如何传染和传播 阅读全文
摘要:
十、假设检验 原文:Testing Hypotheses 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 数据科学家们经常面对世界的是或不是的问题。你在这个课程中看到了一些这样的问题的例子: 巧克力对你有好处吗?Broad Street 水泵的水是否会导致霍乱?加州的人口统计在 阅读全文