12 2019 档案

摘要:通过动态规划思想, 拆分子问题, 结合有向图的联合概率写法, 用到D-separation性质来 优化F/B形式,即状态转移矩阵和发射概率矩阵 阅读全文
posted @ 2019-12-30 21:28 致于数据科学家的小陈 阅读(939) 评论(0) 推荐(0) 编辑
摘要:通过 EM 算法思想来求解参数, 计算核心是 F/B 算法. 阅读全文
posted @ 2019-12-29 00:00 致于数据科学家的小陈 阅读(2036) 评论(0) 推荐(0) 编辑
摘要:HMM 推导分两步, 这篇将隐变量求解部分, 用到Viterbi这样的动态规划算法 阅读全文
posted @ 2019-12-26 23:56 致于数据科学家的小陈 阅读(693) 评论(0) 推荐(0) 编辑
摘要:初步认识一下有向图和无向图, 及其联合概率表示方式. 阅读全文
posted @ 2019-12-25 23:57 致于数据科学家的小陈 阅读(923) 评论(0) 推荐(0) 编辑
摘要:k-means 其实是 EM 算法的特例, 分别举 "人的气质类型" 和 理论角度 来总结 阅读全文
posted @ 2019-12-21 22:18 致于数据科学家的小陈 阅读(2435) 评论(1) 推荐(1) 编辑
摘要:用极大似然来求解参数, 求导很有技巧,之前跟之前LDA相似, 还得用拉格朗日乘子求条件极值 阅读全文
posted @ 2019-12-21 00:00 致于数据科学家的小陈 阅读(600) 评论(0) 推荐(0) 编辑
摘要:基于jesen不等式, 参数似然估计, 全概率与贝叶斯来推导 和证明EM收敛. 阅读全文
posted @ 2019-12-18 00:45 致于数据科学家的小陈 阅读(1633) 评论(0) 推荐(1) 编辑
摘要:从扔硬币算概率,到高斯分布, 进行参数估计来, 直观认识下EM算法思想 阅读全文
posted @ 2019-12-17 20:27 致于数据科学家的小陈 阅读(361) 评论(0) 推荐(0) 编辑
摘要:时间序列 datetime 作为序列索引 阅读全文
posted @ 2019-12-15 22:29 致于数据科学家的小陈 阅读(1066) 评论(0) 推荐(0) 编辑
摘要:简单总结一波k-means 阅读全文
posted @ 2019-12-14 22:40 致于数据科学家的小陈 阅读(490) 评论(0) 推荐(0) 编辑
摘要:datetime 时间的定义, 计算, 字符串-时间 转换 阅读全文
posted @ 2019-12-13 22:25 致于数据科学家的小陈 阅读(1566) 评论(0) 推荐(0) 编辑
摘要:数据分析最重要的技巧, 没有之一. 我的分析工作都是用Excel和pandas 来整透视表, 如论深入了解, 还得Excel + 业务分析 阅读全文
posted @ 2019-12-12 21:55 致于数据科学家的小陈 阅读(713) 评论(0) 推荐(0) 编辑
摘要:数据的split-apply-聚合, 案例-缺失值-重采样-加权平均-线性回归 阅读全文
posted @ 2019-12-10 20:11 致于数据科学家的小陈 阅读(953) 评论(0) 推荐(0) 编辑
摘要:用过浅谈提升树公式 和案例, 来引入 "残差训练"合理性, 引入 XGBoot 的推导需克服的难点. 阅读全文
posted @ 2019-12-09 22:45 致于数据科学家的小陈 阅读(285) 评论(0) 推荐(0) 编辑
摘要:加深对决策树, 集成学习理解, 如bagging, boosting, 为接下来XGBoost推导做准备 阅读全文
posted @ 2019-12-09 18:50 致于数据科学家的小陈 阅读(387) 评论(0) 推荐(0) 编辑
摘要:基于信息熵的决策树构建过程, 随机森林理解 阅读全文
posted @ 2019-12-09 00:31 致于数据科学家的小陈 阅读(667) 评论(0) 推荐(0) 编辑
摘要:Adaboost 算法理解 阅读全文
posted @ 2019-12-08 17:24 致于数据科学家的小陈 阅读(575) 评论(0) 推荐(0) 编辑
摘要:Bagging, 待补充一个 "降低方差"的严格证明 阅读全文
posted @ 2019-12-07 23:40 致于数据科学家的小陈 阅读(463) 评论(0) 推荐(0) 编辑
摘要:集成学习初识, 民主决策. 阅读全文
posted @ 2019-12-07 21:24 致于数据科学家的小陈 阅读(3426) 评论(0) 推荐(0) 编辑
摘要:数据分析重点. 同维度下,对不同字段聚合 groupbby(key).agg({'字段1':'aggfunc1', '字段1':'aggfunc2''..} 阅读全文
posted @ 2019-12-07 17:50 致于数据科学家的小陈 阅读(1407) 评论(0) 推荐(0) 编辑
摘要:用数学定义 "高内聚, 低耦合", 很有难度其实, 然后 转为 最优化问题, 最后用到特征分解来求解. 阅读全文
posted @ 2019-12-06 22:22 致于数据科学家的小陈 阅读(691) 评论(0) 推荐(0) 编辑
摘要:LDA-作为线性判别 分类器 的推导, 其实就是一个贝叶斯公式的过程, 涉及先验概率, 抽样分布, 多元正态分布, 协方差矩阵等, 还有, "优化的思想" 阅读全文
posted @ 2019-12-05 16:20 致于数据科学家的小陈 阅读(1543) 评论(0) 推荐(0) 编辑
摘要:逻辑回归推导, 损失函数, 梯度推导, 证明是凸函数, 模型应用 阅读全文
posted @ 2019-12-04 14:41 致于数据科学家的小陈 阅读(407) 评论(0) 推荐(0) 编辑
摘要:逻辑回归的 logist 函数推导, 从概率论视角. 阅读全文
posted @ 2019-12-03 15:47 致于数据科学家的小陈 阅读(504) 评论(0) 推荐(0) 编辑
摘要:模型泛化优化之 L1 L2 正则化. 涉及正则化认识, 梯度方向来理解, 交叉校验调参, L1 L2比较等 阅读全文
posted @ 2019-12-03 00:00 致于数据科学家的小陈 阅读(617) 评论(0) 推荐(0) 编辑
摘要:模型优化评估, 扩充基, 过拟合, 模型的Bias, Variance 阅读全文
posted @ 2019-12-02 16:09 致于数据科学家的小陈 阅读(571) 评论(0) 推荐(0) 编辑
摘要:group by 过程, 数据分析中,绝对是最为重要的部分, 没有之一. 阅读全文
posted @ 2019-12-01 21:29 致于数据科学家的小陈 阅读(1860) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示