摘要: https://zhuanlan.zhihu.com/p/371379774 阅读全文
posted @ 2021-08-16 16:26 哈哈哈喽喽喽 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 大多数机器学习模型对非正态分布的数据的效果不佳,因此,我们对数据进行变换boxcox1p https://zhuanlan.zhihu.com/p/53288624 搭建模型,特别是线性模型是希望数据符合正态分布的,但现实中的数据并不符合。 今天讲讨论其中的一种情况。 长跑比赛中,跑得最快的几个人之 阅读全文
posted @ 2021-08-16 11:55 哈哈哈喽喽喽 阅读(463) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/234833433 之前笔者在做一个金融数据项目时,有朋友问我,衡量股票收益率有没有什么好的方法。这个问题让笔者也思索了好久,其实股票的收益率如果我们从本质来看不就是数据吗,无非就是收益率我们就想让其越高越好,也就是让这个数据增加得越多越好。 阅读全文
posted @ 2021-08-16 11:26 哈哈哈喽喽喽 阅读(1061) 评论(0) 推荐(0) 编辑
摘要: https://www.kaggle.com/c/california-house-prices/data?select=train.csv https://cloud.tencent.com/developer/article/1466590 1. 加载数据,理解各特征含义 画出相关性图,针对各相 阅读全文
posted @ 2021-08-16 10:28 哈哈哈喽喽喽 阅读(53) 评论(0) 推荐(0) 编辑