05 2021 档案

摘要:当时序数据不连续时,需要将连续的数据划分为一块,基于pandas dataframe的方案如下。 >>> df DateAnalyzed Val 1 2018-03-18 0.470253 2 2018-03-19 0.470253 3 2018-03-20 0.470253 4 2017-01-2 阅读全文
posted @ 2021-05-20 17:42 zcsh 阅读(823) 评论(0) 推荐(0) 编辑
摘要:摘要 本文对lgb的基本原理进行简要概括。 基于直方图的节点分裂 lgbm使用基于直方图的分裂点选择算法,分裂准则为最小化方差,也即最大化方差增益variance gain: 对比xgb的loss reduction: 可以发现,两者是一致的,不同点在于,xgb的loss reduction包含了正 阅读全文
posted @ 2021-05-13 15:04 zcsh 阅读(1643) 评论(0) 推荐(1) 编辑
摘要:摘要 XGBoost是GBDT的一个高效实现,本文对xgboost的实现细节进行记录。 算法原理 正则化损失(regularized loss objective) 为避免过拟合,xgb使用带正则化项的损失函数。正则化项包含两部分:树的叶子节点个数和每个叶子节点的分数。 梯度树提升(gradient 阅读全文
posted @ 2021-05-10 20:19 zcsh 阅读(1373) 评论(0) 推荐(0) 编辑