联合会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
蜡笔小xi
未经审视的人生,不值一过
博客园
首页
新随笔
联系
订阅
管理
随笔 - 5
文章 - 0
评论 - 0
阅读 -
8013
06 2022 档案
几种常见采样方法及原理
摘要:不平衡数据集是指类别分布严重偏斜的数据集,例如少数类与多数类的样本比例为 1:100 或 1:1000。 训练集中的这种偏差会影响许多机器学习算法,甚至导致完全忽略少数类,容易导致模型过拟合,泛化能力差。 所以,针对类别分布不均衡的数据集,一般会采取采样的方式,使得类别分布相对均衡,提升模型泛化能力
阅读全文
posted @
2022-06-08 16:54
xihuishaw
阅读(3293)
评论(0)
推荐(0)
编辑
公告
昵称:
xihuishaw
园龄:
5年3个月
粉丝:
0
关注:
2
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
SQL
(1)
随笔分类
时间序列(1)
数仓(3)
数据处理(1)
随笔档案
2022年8月(3)
2022年6月(1)
2022年3月(1)
阅读排行榜
1. 浅谈SQL中的循环(3636)
2. 几种常见采样方法及原理(3293)
3. (转载)GaussDB(DWS)性能调优系列基础篇三:分布式计划详解(442)
4. 基于Streamlit_prophet玩转Prophet时序预测(335)
5. (转载)GaussDB(DWS)性能调优系列实战篇四:十八般武艺之SQL改写(306)
点击右上角即可分享