摘要: <! flowchart 箭头图标 勿删 高斯分布 参考这里: https://en.wikipedia.org/wiki/Normal_distribution 极大似然估计 参考这里: https://blog.csdn.net/qq_23869697/article/details/79774 阅读全文
posted @ 2019-08-21 12:19 likedata 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 记得在做电商运营初期,每每为我们频道的促销活动锁取得的“超高”销售额感动,但后来随着工作的深入,我越来越觉得这里面水很深。商家运营、品类运营不断的通过刷单来获取其所需,或是商品搜索排名,或是某种kpi指标,但这些所谓的“脏数据”,却妨碍了平台运营者对于真实数据的分析和促销效果的评估。今天我们讨论一种 阅读全文
posted @ 2019-08-21 12:09 likedata 阅读(301) 评论(0) 推荐(0) 编辑
摘要: <! flowchart 箭头图标 勿删 梯度下降(导数、方向导数 and 梯度引入斜率、导数 and 梯度斜率、导数偏导数方向导数梯度梯度下降反向传播 引入 在机器学习与深度学习中,对损失函数最小化时经常使用的算法就是梯度下降。当然还有很多优化算法,本文先对梯度下降与反向传播进行介绍。 斜率、导数 阅读全文
posted @ 2019-08-20 22:05 likedata 阅读(962) 评论(0) 推荐(0) 编辑
摘要: 显著性水平α与P值: 1、显著性水平是估计总体参数落在某一区间内,可能犯错误的概率,用α表示。 显著性是对差异的程度而言的,是在进行假设检验前确定的一个可允许作为判断界限的小概率标准。 2、P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。 P值(P value)就 阅读全文
posted @ 2019-07-29 17:25 likedata 阅读(1403) 评论(0) 推荐(0) 编辑
摘要: 安装过程: 1. 首先我们引入jupyter_contrib_nbextension这个第三方库。 2. 在Anaconda Promot中输入命令: pip install jupyter_contrib_nbextensions && jupyter contrib nbextension in 阅读全文
posted @ 2019-07-22 13:03 likedata 阅读(5886) 评论(1) 推荐(2) 编辑
摘要: ①自变量不能相关,即排除自相关性,还有共线性;②变量一定要显著。③变量要独立同分布。 所以我们要进行共线性筛查,显著性筛查,相关性筛查,才能选择出入模变量。 9. 逻辑回归创建评分卡模型核心步骤: a) 变量分箱,可以排除异常值的影响,分法有等宽、等频、人工指定分箱、C4.5决策树、卡方分箱。 b) 阅读全文
posted @ 2019-07-15 00:33 likedata 阅读(686) 评论(0) 推荐(0) 编辑
摘要: import matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示负号 阅读全文
posted @ 2019-07-13 15:44 likedata 阅读(1810) 评论(0) 推荐(0) 编辑
摘要: 独立和互斥的区别在此省略,比较好理解。 首先我们看协方差的定义: Cov(X, Y) = E{[X - E(X)][Y - E(Y)]}. 协方差的性质有: Cov(X, Y) = Cov(Y, X) Cov(aX+b, cY+d) = acCov(X, Y) Cov(X1+X2, Y) = Cov 阅读全文
posted @ 2019-07-03 16:51 likedata 阅读(5050) 评论(0) 推荐(0) 编辑