摘要: 转载来源:https://mp.weixin.qq.com/s?__biz=MzkyMjE3NjEyNA==&mid=2247484375&idx=1&sn=8dc6b81296695286bf6c0e1d648bdd79&chksm=c1f91cc4f68e95d2f36d38521806a557 阅读全文
posted @ 2022-08-26 14:02 xihuishaw 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 转载来源:https://mp.weixin.qq.com/s?__biz=MzkyMjE3NjEyNA==&mid=2247484462&idx=1&sn=a5191c263bfc4eca5fae0073d2db6fa4&chksm=c1f91b3df68e922b526dba5e85d96633 阅读全文
posted @ 2022-08-26 13:11 xihuishaw 阅读(306) 评论(0) 推荐(0) 编辑
摘要: 在日常的数据分析中,经常会遇到一类问题:计算从某个时间点开始的累计数据,但在某些时间点又是没有数据的,需得到的结果是每个时间点的累计数据。 比如以下情况,左边是原始数据,右边是期望输出数据: 因为大部分数据库不像其他编程语言,没有函数式编程,不能直接for循环。如果支持游标循环,则比较容易实现。 下 阅读全文
posted @ 2022-08-25 17:58 xihuishaw 阅读(3636) 评论(0) 推荐(0) 编辑
摘要: 不平衡数据集是指类别分布严重偏斜的数据集,例如少数类与多数类的样本比例为 1:100 或 1:1000。 训练集中的这种偏差会影响许多机器学习算法,甚至导致完全忽略少数类,容易导致模型过拟合,泛化能力差。 所以,针对类别分布不均衡的数据集,一般会采取采样的方式,使得类别分布相对均衡,提升模型泛化能力 阅读全文
posted @ 2022-06-08 16:54 xihuishaw 阅读(3293) 评论(0) 推荐(0) 编辑
摘要: 既然是玩转,就得easy,在通俗搞懂核心原理的基础上,重在实践。 本文首先介绍Prophet模型基本使用,再介绍一个开箱即用的开源项目--Streamlit_prophet,进一步降低Prophet使用门槛(甚至给运营、业务都会用~) 简介 时间序列受4种成分影响: 趋势:宏观、长期、持续性的作用力 阅读全文
posted @ 2022-03-11 16:27 xihuishaw 阅读(336) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示