会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
骑着赶路
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
34
下一页
2020年7月8日
利用PermutationImportance挑选变量
摘要:
阅读全文
posted @ 2020-07-08 22:50 骑者赶路
阅读(719)
评论(0)
推荐(0)
编辑
模型评估和验证【1】——过拟合、欠拟合、学习曲线、验证曲线
摘要: https://blog.csdn.net/qq_20412595/article/details/81771790
阅读全文
posted @ 2020-07-08 15:42 骑者赶路
阅读(269)
评论(0)
推荐(0)
编辑
2020年7月7日
偏差与方差
摘要: 打靶场上来了4个枪手,开始打靶,PIAPIAPIA……一阵枪响,不一会儿,打靶成绩出来了。以下是4位抢手的打靶结果: 不难看出,第一位抢手打的又准,而且稳定性也好,把把命中红星。第二位枪手惨不忍睹,打的又偏,而且又毫无章法。第三位抢手准度一般,好在稳定性还不错,只要提升下准度,还是可以抢救一下。第四
阅读全文
posted @ 2020-07-07 23:51 骑者赶路
阅读(480)
评论(0)
推荐(0)
编辑
机器学习模型评估与超参数调优详解(转)
摘要: https://zhuanlan.zhihu.com/p/140040705
阅读全文
posted @ 2020-07-07 23:33 骑者赶路
阅读(153)
评论(0)
推荐(0)
编辑
我的XGBoost学习经历及动手实践(转)
摘要: 原文为深圳大学的李祖贤 https://zhuanlan.zhihu.com/p/143009353
阅读全文
posted @ 2020-07-07 23:02 骑者赶路
阅读(198)
评论(0)
推荐(0)
编辑
2020年7月1日
精通特征工程
摘要: 一 数值类型 原因:数值类型可能跨度过大,跨几个数量级,不符合模型的前提条件。拟合出来的模型不够强壮。 1 二值化 2 处理长尾分布数量,有两种思路,一种是对数处理,一种是分箱处理。处理的原因还是因为横跨了若干个数量级,对很多模型都是问题。 3 归一化,处理设计欧式距离的算法,比如KNN,K-mea
阅读全文
posted @ 2020-07-01 19:34 骑者赶路
阅读(285)
评论(0)
推荐(0)
编辑
2020年6月25日
reduce_mem_usage 降低内存使用 绘制学习率曲线和验证曲线
摘要: def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and modify the data type to reduce memory usage. """ start_mem = df.memor
阅读全文
posted @ 2020-06-25 19:45 骑者赶路
阅读(593)
评论(0)
推荐(0)
编辑
正态性检验 Python正态性检验
摘要: https://blog.csdn.net/QimaoRyan/article/details/72861387?locationNum=9&fps=1
阅读全文
posted @ 2020-06-25 17:34 骑者赶路
阅读(150)
评论(0)
推荐(0)
编辑
pd.melt Pandas 的melt的使用
摘要: https://blog.csdn.net/maymay_/article/details/80039677
阅读全文
posted @ 2020-06-25 14:51 骑者赶路
阅读(278)
评论(0)
推荐(0)
编辑
2020年6月24日
pandas dataframe 格式设置 set_option
摘要: https://www.cnblogs.com/figo-studypath/p/9772630.html
阅读全文
posted @ 2020-06-24 14:09 骑者赶路
阅读(1368)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
···
34
下一页
公告