用python脚本通过excel生成文件夹树结构
大概这样写标题是对的吧。。。
目标:
通过excel目录结构文档生成文件夹树结构。
也就是:
通过下面的excel
生成下面的文档树结构:
方法:
1、分析:一般文档结构都是事先构思好。可以在txt文档里打草稿,粘贴至excel。如下:
这里要注意一个问题:从txt文档 -> excel文档粘贴时,默认如果txt分级为空格,那么在excel里只能是一列。如果在txt分级为tab,那么在excel中各为一列。当然,可以自己进行设置。
2、对excel文档结构进行路劲补全。如图:
3、写py脚本:
#coding:utf-8 import xlrd import os import sys DIRPATH = os.path.dirname(os.path.realpath(__file__)) excelFILE = ur"%s"%sys.argv[1] #对中文字符转码,避免乱码 encodeText = lambda a : a.encode("gb2312") def get_data_by_xls(xlsfile): '''通过xls文档得到数据列表''' wb = xlrd.open_workbook(xlsfile) table = wb.sheets()[0] rows = table.nrows for i in range(table.nrows): yield table.row_values(i) def createDir(dirPath,xList): '''应用递归,生成文档数''' try: rPath = os.path.join(dirPath,encodeText(xList[0])) try: os.mkdir(rPath) rList = xList[1:] except: rList = xList[1:] createDir(rPath,rList) except: pass for i in get_data_by_xls(excelFILE): if i: createDir(DIRPATH,i) print "create dir complete!"
4、运行:
得到结构:
5、总结:
(1)生成文档时需对中文进行转码,不然导致乱码。
(2)生成文件夹时对路径进行递归处理。
(3)在excel文档目录中,各个目录均要补全为完整的路径。
(4)在获取目录列表时,该脚本使用了yield生成器,避免excel目录多占用过多内存的问题,但一般的excel倒是用不到。直接返回列表就OK了。
==============================================================================
人生苦短,我用python!