Loading [MathJax]/jax/element/mml/optable/GeneralPunctuation.js

随笔分类 -  统计数学

统计概念、方法,数学
摘要:1.数据运营,你会关注哪些指标? 1.拉新指标 浏览量、注册量、拉新成本 2.活跃指标 活跃用户数、活跃率、在线时长 3.留存指标 用户留存率、用户流失率 4.用户价值/转化指标 用户生命周期价值(CLV)、成交额、复购率、付费用户数 5.裂变指标: 裂变k因子 :发起邀请的用户数*转化率 、传播周 阅读全文
posted @ 2020-11-06 17:07 从前有座山,山上 阅读(172) 评论(0) 推荐(0) 编辑
摘要:数据不平衡 1.什么是数据不平衡 一般都是假设数据分布是均匀的,每种样本的个数差不多,但是现实情况下我们取到的数据并不是这样的,如果直接将分布不均的数据直接应用于算法,大多情况下都无法取得理想的结果。 这里着重考虑二分类,因为解决了二分类种的数据不平衡问题后,推而广之酒能得到多分类情况下的解决方案。 阅读全文
posted @ 2020-10-29 18:46 从前有座山,山上 阅读(1103) 评论(0) 推荐(0) 编辑
摘要:概率空间(Ω,B,P,) Ω:包含概率空间最小不可分的独立事件 B:定义事件可能的相互组合 P:给定\mathcal中组合发生的可能性大小 阅读全文
posted @ 2020-06-29 20:09 从前有座山,山上 阅读(320) 评论(0) 推荐(0) 编辑
摘要:牛顿法的应用: 1.求根:原理是函数f(x)展开到一阶导。 2.最优化:原理是函数f(x)展开到二阶导。 就应用2进行推导: f(x+x)=f(x)+f(x)x+12f 这个式 阅读全文
posted @ 2020-04-14 11:51 从前有座山,山上 阅读(603) 评论(0) 推荐(0) 编辑
摘要:函数空间 = 元素 + 规则 ,即一个函数空间由 元素 与 元素所满足的规则 定义,而要明白这些函数空间的定义首先得从距离,范数,内积,完备性等基本概念说起。 一.距离 说到距离,我们首先想到的是点与点之间的距离,除此之外还有向量之间的距离,曲线之间的距离,函数之间的距离…。这儿谈到 距离 的定义是 阅读全文
posted @ 2020-04-07 12:41 从前有座山,山上 阅读(1057) 评论(0) 推荐(0) 编辑
摘要:【转发】: 我们学习的过程是从代数方程到常微分方程,再到偏微分方程。从物理上看,就是为了更精确描述实际。 你以固定的速度,跑完操场一圈,你跑步的速度等于操场长度除以你花的时间。这是代数方程。可是实际上你的速度是变化的,严格的讲时刻都可能变化,你可以用常微分方程来描述这个过程。解方程的过程是根据已有的 阅读全文
posted @ 2020-03-23 19:41 从前有座山,山上 阅读(2494) 评论(0) 推荐(0) 编辑
摘要:最小二乘法可以用于线性回归模型的参数估计,产生最佳线性无偏估计量,此时不对误差ε的分布形式作任何假设。最小二乘法可以产生β0与β1的最佳线性无偏估计量,其他统计过程,比如假设检验与置信区间构造,都假设误差服从正态分布,如果误差的分布形式一致,那么就可以使用另一种参数估计方法——极大似然法。 比如极大 阅读全文
posted @ 2020-02-27 21:08 从前有座山,山上 阅读(675) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-02-21 22:04 从前有座山,山上 阅读(243) 评论(0) 推荐(0) 编辑
摘要:转载:https://www.cnblogs.com/qamra/p/8721561.html 超参数的定义:在机器学习的上下文中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。 理解:超参 阅读全文
posted @ 2020-02-16 13:02 从前有座山,山上 阅读(362) 评论(0) 推荐(0) 编辑
摘要:给定了一个时间顺序向量z_1,...,z_T,rw模型是由次序r来定义的,z_t仅取决于前t r个元素。当r = 1时为最简单的RW模型。 给定了向量的其他元素,z_t的条件分布为: z_t|z_{t 1} ~ Normal(z_{t 1} ,\sigma^2) 阅读全文
posted @ 2020-02-13 18:01 从前有座山,山上 阅读(2591) 评论(0) 推荐(0) 编辑
摘要:转载:https://blog.csdn.net/donggui8650/article/details/101556041 在概率论中,对数正态分布是一种连续概率分布,其随机变量的对数服从正态分布。 从统计学角度理解对数正态分布是这样的,在自然界有很多事物有增长速度很慢,甚至可以忽略不计(smal 阅读全文
posted @ 2020-02-12 11:38 从前有座山,山上 阅读(3276) 评论(0) 推荐(0) 编辑
摘要:转载:https://blog.csdn.net/SecondLieutenant/article/details/79625694 面板数据(Panel Data)是将“截面数据”和“时间序列数据”综合起来的一种数据类型。具有“横截面”和“时间序列”两个维度,当这类数据按两个维度进行排列时,数据都 阅读全文
posted @ 2020-01-15 21:22 从前有座山,山上 阅读(4010) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示