字符串分隔排序问题

需求：

现有多个文件，每个文件有如下格式，需将所有文件的数据合并并按照第一列排序，数据按空格分隔。数据量较大，在excel内不能完成。

数据格式如下：

0.01 0 50661888 8 1
0.01 0 50661896 8 1
21.27 0 50661904 8 1
4616.62 0 92880896 8 1
4616.64 0 92880904 8 1
4616.64 0 92880912 8 1
4616.64 0 92880920 8 1
4616.65 0 92880928 8 1
4616.65 0 92880936 8 1

python：

#!/usr/bin/env python

import os
import sys
#import pandas

#fs = sys.argv[1:]
fs = os.listdir("E:\\Dataspace\\zhou")
def proc_file_one(filename, lst):
    f = file(filename, "r")
    for line in f.readlines():
        line = line.rstrip("\n")
        tp = tuple(line.split(" "))
        if len(tp) > 1:
            lst.append(tp)
    f.close()
    return lst

def f(a):
    return float(a[0])

lst = []
out = ""

for i in fs:
    i = os.path.join("E:\\Dataspace\\zhou", i)
    lst = proc_file_one(i, lst)

for i in sorted(lst, key=f):
    out = out + " ".join(i) + '\n'

f=open("E:\Dataspace\zhou\out.txt", 'w')
f.write(out)
#print >>f, out
f.close()

posted on 2015-04-14 11:38 鱼丸粗线阅读(190) 评论(0) 编辑收藏举报

刷新页面返回顶部

字符串分隔排序问题

导航

公告