随笔分类 - 数据建模与挖掘
侧重数据挖掘,模型算法原理推导, ML等.
摘要:基于jesen不等式, 参数似然估计, 全概率与贝叶斯来推导 和证明EM收敛.
阅读全文
摘要:从扔硬币算概率,到高斯分布, 进行参数估计来, 直观认识下EM算法思想
阅读全文
摘要:读陈天奇博士原论文并跟随文哲大佬手推XGBoost算法
阅读全文
摘要:用过浅谈提升树公式 和案例, 来引入 "残差训练"合理性, 引入 XGBoot 的推导需克服的难点.
阅读全文
摘要:加深对决策树, 集成学习理解, 如bagging, boosting, 为接下来XGBoost推导做准备
阅读全文
摘要:基于信息熵的决策树构建过程, 随机森林理解
阅读全文
摘要:Bagging, 待补充一个 "降低方差"的严格证明
阅读全文
摘要:集成学习初识, 民主决策.
阅读全文
摘要:用数学定义 "高内聚, 低耦合", 很有难度其实, 然后 转为 最优化问题, 最后用到特征分解来求解.
阅读全文
摘要:LDA-作为线性判别 分类器 的推导, 其实就是一个贝叶斯公式的过程, 涉及先验概率, 抽样分布, 多元正态分布, 协方差矩阵等, 还有, "优化的思想"
阅读全文
摘要:逻辑回归推导, 损失函数, 梯度推导, 证明是凸函数, 模型应用
阅读全文
摘要:逻辑回归的 logist 函数推导, 从概率论视角.
阅读全文
摘要:模型泛化优化之 L1 L2 正则化. 涉及正则化认识, 梯度方向来理解, 交叉校验调参, L1 L2比较等
阅读全文
摘要:模型优化评估, 扩充基, 过拟合, 模型的Bias, Variance
阅读全文
摘要:线性回归的推导和求解. 分别从 矩阵代数, 微积分, 概率论, Pyhton 实现求解等, 巩固我的6年经验了.
阅读全文
摘要:号称全站最直观解释-smv核函数-是干啥
阅读全文