摘要: imbalanced-learn是一个Python库,‌专门用于处理不平衡数据集的机器学习问题。‌ 这个库提供了一系列的重采样技术、‌组合方法和机器学习算法,‌旨在提高在不平衡数据集上的分类性能。‌Imbalanced-learn支持欠采样、‌过采样、‌结合欠采样和过采样的方法,‌以及一些集成学习方 阅读全文
posted @ 2024-07-28 19:24 红酒人生 阅读(36) 评论(0) 推荐(0) 编辑
摘要: CatBoost是一种机器学习库,‌由俄罗斯的搜索巨头Yandex在2017年开源。‌它属于Boosting族算法的一种,‌与XGBoost、‌LightGBM并称为GBDT的三大主流神器。‌CatBoost的主要作用和创新点在于高效合理地处理类别型特征,‌这是从其名称中的"Cat"(‌分类)‌和" 阅读全文
posted @ 2024-07-28 18:18 红酒人生 阅读(28) 评论(0) 推荐(0) 编辑
摘要: XGBoost是一个非常强大的Boosting算法工具包,‌以其优秀的性能(‌效果与速度)‌在数据科学比赛中长期占据领先地位,‌并且在许多大厂的机器学习方案中也是首选模型。‌ XGBoost在并行计算效率、‌缺失值处理、‌控制过拟合、‌预测泛化能力等方面表现出色。‌它的主要特点和优势包括:‌ 并行计 阅读全文
posted @ 2024-07-28 18:13 红酒人生 阅读(19) 评论(0) 推荐(0) 编辑
摘要: 运营商客户流失分析与预测 背景 提出问题 理解数据 数据清洗 可视化分析 用户流失预测 结论和建议 一、背景 关于用户留存有这样一个观点,如果将用户流失率降低5%,公司利润将提升25%-85%。如今高居不下的获客成本让移动运营商遭遇“天花板”,甚至陷入获客难的窘境。随着市场饱和度上升,移动运营商亟待 阅读全文
posted @ 2024-07-28 17:26 红酒人生 阅读(131) 评论(0) 推荐(0) 编辑