12 2019 档案
摘要:通过动态规划思想, 拆分子问题, 结合有向图的联合概率写法, 用到D-separation性质来 优化F/B形式,即状态转移矩阵和发射概率矩阵
阅读全文
摘要:通过 EM 算法思想来求解参数, 计算核心是 F/B 算法.
阅读全文
摘要:HMM 推导分两步, 这篇将隐变量求解部分, 用到Viterbi这样的动态规划算法
阅读全文
摘要:初步认识一下有向图和无向图, 及其联合概率表示方式.
阅读全文
摘要:k-means 其实是 EM 算法的特例, 分别举 "人的气质类型" 和 理论角度 来总结
阅读全文
摘要:用极大似然来求解参数, 求导很有技巧,之前跟之前LDA相似, 还得用拉格朗日乘子求条件极值
阅读全文
摘要:基于jesen不等式, 参数似然估计, 全概率与贝叶斯来推导 和证明EM收敛.
阅读全文
摘要:从扔硬币算概率,到高斯分布, 进行参数估计来, 直观认识下EM算法思想
阅读全文
摘要:时间序列 datetime 作为序列索引
阅读全文
摘要:datetime 时间的定义, 计算, 字符串-时间 转换
阅读全文
摘要:数据分析最重要的技巧, 没有之一. 我的分析工作都是用Excel和pandas 来整透视表, 如论深入了解, 还得Excel + 业务分析
阅读全文
摘要:数据的split-apply-聚合, 案例-缺失值-重采样-加权平均-线性回归
阅读全文
摘要:用过浅谈提升树公式 和案例, 来引入 "残差训练"合理性, 引入 XGBoot 的推导需克服的难点.
阅读全文
摘要:加深对决策树, 集成学习理解, 如bagging, boosting, 为接下来XGBoost推导做准备
阅读全文
摘要:基于信息熵的决策树构建过程, 随机森林理解
阅读全文
摘要:Bagging, 待补充一个 "降低方差"的严格证明
阅读全文
摘要:集成学习初识, 民主决策.
阅读全文
摘要:数据分析重点. 同维度下,对不同字段聚合 groupbby(key).agg({'字段1':'aggfunc1', '字段1':'aggfunc2''..}
阅读全文
摘要:用数学定义 "高内聚, 低耦合", 很有难度其实, 然后 转为 最优化问题, 最后用到特征分解来求解.
阅读全文
摘要:LDA-作为线性判别 分类器 的推导, 其实就是一个贝叶斯公式的过程, 涉及先验概率, 抽样分布, 多元正态分布, 协方差矩阵等, 还有, "优化的思想"
阅读全文
摘要:逻辑回归推导, 损失函数, 梯度推导, 证明是凸函数, 模型应用
阅读全文
摘要:逻辑回归的 logist 函数推导, 从概率论视角.
阅读全文
摘要:模型泛化优化之 L1 L2 正则化. 涉及正则化认识, 梯度方向来理解, 交叉校验调参, L1 L2比较等
阅读全文
摘要:模型优化评估, 扩充基, 过拟合, 模型的Bias, Variance
阅读全文
摘要:group by 过程, 数据分析中,绝对是最为重要的部分, 没有之一.
阅读全文