2018年1月22日

摘要: 还是先看一下这个故事: 此捆绑销售方式是由沃尔玛一家分店的营销经理发现的。刚开始他对超市的销售数量进行设定跟踪,有一次他发现了一个很奇怪的现象,啤酒与尿不湿的销量在周末总会出现成比例增长。他们立即对这个现象进行了分析和讨论,并且派出专门的人员在卖场内进行全天候的观察。最后,谜底终于水落石出,发现啤酒 阅读全文

posted @ 2018-01-22 17:50 糖馅味 阅读(609) 评论(0) 推荐(0) 编辑

摘要: 先来看看分类器的概念: knn算法 邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻 阅读全文

posted @ 2018-01-22 17:49 糖馅味 阅读(271) 评论(0) 推荐(0) 编辑

2018年1月21日

摘要: 线性回归 (1)线性回归的主要内容: 有兴趣可以玩一下这个游戏:是猜相关系数的,给你一些散点图,猜相关系数,很难猜对,说明看图说明相关性不靠谱! (2)线性回归怎么做?数学公式 一个简单线性回归的例子: ols: 拟合优度: (3) 假设检验 线性回归这位老师用的是statsmodels做的。 这就 阅读全文

posted @ 2018-01-21 15:19 糖馅味 阅读(30423) 评论(1) 推荐(1) 编辑

2018年1月20日

摘要: 1、假设检验 做出一个假设,去验证。 需要设定置信度,如95% 两类错误: 两类错误是概率 原假设一般为等式。 样本量的影响: 步骤:假设—置信度—收集数据—计算p值判断 T检验 拒绝域和接受域。 单样本T检验,没有数据,这个课程没有数据,很遗憾,一会在找数据从新做一遍! 两变量 男生和女生的月均支 阅读全文

posted @ 2018-01-20 12:08 糖馅味 阅读(894) 评论(1) 推荐(0) 编辑

摘要: Jupyter Notebook 的快捷键 Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元框线是灰色。 命令模式 (按键 Esc 开启) Enter : 转入编辑模式 Shift-Ent 阅读全文

posted @ 2018-01-20 10:08 糖馅味 阅读(147) 评论(0) 推荐(0) 编辑