05 2021 档案
摘要:当时序数据不连续时,需要将连续的数据划分为一块,基于pandas dataframe的方案如下。 >>> df DateAnalyzed Val 1 2018-03-18 0.470253 2 2018-03-19 0.470253 3 2018-03-20 0.470253 4 2017-01-2
阅读全文
摘要:摘要 本文对lgb的基本原理进行简要概括。 基于直方图的节点分裂 lgbm使用基于直方图的分裂点选择算法,分裂准则为最小化方差,也即最大化方差增益variance gain: 对比xgb的loss reduction: 可以发现,两者是一致的,不同点在于,xgb的loss reduction包含了正
阅读全文
摘要:摘要 XGBoost是GBDT的一个高效实现,本文对xgboost的实现细节进行记录。 算法原理 正则化损失(regularized loss objective) 为避免过拟合,xgb使用带正则化项的损失函数。正则化项包含两部分:树的叶子节点个数和每个叶子节点的分数。 梯度树提升(gradient
阅读全文