摘要:
imbalanced-learn是一个Python库,专门用于处理不平衡数据集的机器学习问题。 这个库提供了一系列的重采样技术、组合方法和机器学习算法,旨在提高在不平衡数据集上的分类性能。Imbalanced-learn支持欠采样、过采样、结合欠采样和过采样的方法,以及一些集成学习方 阅读全文
摘要:
CatBoost是一种机器学习库,由俄罗斯的搜索巨头Yandex在2017年开源。它属于Boosting族算法的一种,与XGBoost、LightGBM并称为GBDT的三大主流神器。CatBoost的主要作用和创新点在于高效合理地处理类别型特征,这是从其名称中的"Cat"(分类)和" 阅读全文
摘要:
XGBoost是一个非常强大的Boosting算法工具包,以其优秀的性能(效果与速度)在数据科学比赛中长期占据领先地位,并且在许多大厂的机器学习方案中也是首选模型。 XGBoost在并行计算效率、缺失值处理、控制过拟合、预测泛化能力等方面表现出色。它的主要特点和优势包括: 并行计 阅读全文
摘要:
运营商客户流失分析与预测 背景 提出问题 理解数据 数据清洗 可视化分析 用户流失预测 结论和建议 一、背景 关于用户留存有这样一个观点,如果将用户流失率降低5%,公司利润将提升25%-85%。如今高居不下的获客成本让移动运营商遭遇“天花板”,甚至陷入获客难的窘境。随着市场饱和度上升,移动运营商亟待 阅读全文