摘要:
简单总结一波k-means 阅读全文
摘要:
datetime 时间的定义, 计算, 字符串-时间 转换 阅读全文
摘要:
数据分析最重要的技巧, 没有之一. 我的分析工作都是用Excel和pandas 来整透视表, 如论深入了解, 还得Excel + 业务分析 阅读全文
摘要:
数据的split-apply-聚合, 案例-缺失值-重采样-加权平均-线性回归 阅读全文
摘要:
用过浅谈提升树公式 和案例, 来引入 "残差训练"合理性, 引入 XGBoot 的推导需克服的难点. 阅读全文
摘要:
加深对决策树, 集成学习理解, 如bagging, boosting, 为接下来XGBoost推导做准备 阅读全文
摘要:
基于信息熵的决策树构建过程, 随机森林理解 阅读全文
摘要:
Adaboost 算法理解 阅读全文
摘要:
Bagging, 待补充一个 "降低方差"的严格证明 阅读全文
摘要:
集成学习初识, 民主决策. 阅读全文
摘要:
数据分析重点. 同维度下,对不同字段聚合 groupbby(key).agg({'字段1':'aggfunc1', '字段1':'aggfunc2''..} 阅读全文
摘要:
用数学定义 "高内聚, 低耦合", 很有难度其实, 然后 转为 最优化问题, 最后用到特征分解来求解. 阅读全文
摘要:
LDA-作为线性判别 分类器 的推导, 其实就是一个贝叶斯公式的过程, 涉及先验概率, 抽样分布, 多元正态分布, 协方差矩阵等, 还有, "优化的思想" 阅读全文
摘要:
逻辑回归推导, 损失函数, 梯度推导, 证明是凸函数, 模型应用 阅读全文
摘要:
逻辑回归的 logist 函数推导, 从概率论视角. 阅读全文