linux文件处理

取中间的行数作为train.txt

sed -n '1000000,170910580p' train.txt > trainv1.txt

   

取前面的行数作为dev.txt

head -1000000 train.txt > dev.txt

   

取后面的行数作为test.txt

tail -1000000 train.txt > test.txt

 

打乱文本中顺序

shuf filteredTop50Data.tsv -o shuffleFilteredTop50Data.tsv

posted @ 2019-01-10 16:26  simple_wxl  阅读(436)  评论(0编辑  收藏  举报