Mixture

身未动,心已远

导航

2014年4月5日 #

文件按行随机排列

摘要: 今天碰到了个需求,就是我需要在一个文件里随机抽一些行出来做训练集,剩下的做测试集。因为原来的文件排列有一定的顺序可能影响结果,所以不能直接head或者tail。我以为肯定有个命令很方便的完成这件事情,结果搜了半天没搜到可以直接用的(可能还是有,只是我太蠢没有找到。。。),结果发现了一个博客是用c结合shell做的,感觉还挺不错。思路就是用c把文件每行的尾部加上一个随机数(各行后面的随机数不重复),之后再用shell按最后一列排序就好。原文在这里:http://blog.csdn.net/liyuxia713/article/details/7445592备份下代码在下面://random.c# 阅读全文

posted @ 2014-04-05 10:52 parapax 阅读(888) 评论(0) 推荐(0) 编辑