摘要: 最近在用SVM为分类器做实验,但是发现数据量太大(2000k条记录)但是训练时间过长...让我足足等了1天的啊!有人指导说可以先进行一下随机采样,再训练,这样对训练结果不会有太大影响(这个待考证)。所以就对数据进行了一下降采样,具体方法如下:shuf data | head -n 100000其中,... 阅读全文
posted @ 2014-08-01 12:23 Beanocean 阅读(727) 评论(0) 推荐(0) 编辑