会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
渡
我要去远航...
博客园
首页
新随笔
联系
订阅
管理
2014年8月1日
利用shuf对数据记录进行随机采样
摘要: 最近在用SVM为分类器做实验,但是发现数据量太大(2000k条记录)但是训练时间过长...让我足足等了1天的啊!有人指导说可以先进行一下随机采样,再训练,这样对训练结果不会有太大影响(这个待考证)。所以就对数据进行了一下降采样,具体方法如下:shuf data | head -n 100000其中,...
阅读全文
posted @ 2014-08-01 12:23 Beanocean
阅读(728)
评论(0)
推荐(0)
编辑
公告