拆分文本文件
# -*- coding: utf-8 -*- import os import pandas as pd def split_csv(src_file_name, num, flag, file_encoding): df = pd.read_csv(src_file_name, encoding='gbk') # total_num,原始文件总行数;num_tmp根据num计算出文件个数或每个文件行数 total_num = df.shape[0] num_tmp = float(total_num / num) # 算出有小数时,加1 if int(num_tmp) < num_tmp: num2 = int(num_tmp) + 1 else: num2 = int(num_tmp) # print(num2) if flag == 0: pass elif flag == 1: # 原始脚本是当flag ==0 时设计的;当为1时,交换一下参数 num, num2 = num2, num print(num, num2, total_num) # 文件名和扩展名分开 f_name, f_extension = os.path.splitext(src_file_name) for i in range(1, num2 + 1): df.iloc[(i - 1) * num:i * num].to_csv( f"{f_name}{i}{file_encoding}{f_extension}", index=False, encoding=file_encoding) print(i) if __name__ == '__main__': # 设置原始数据名称 src_file_name = '银行交易流水.txt' # 设置结果每个文件数据行数 num = 10000 # 设置结果文件编码格式 file_encoding = 'utf-8' # flag:0:num为每个文件的行数;1:num为分成文件数 flag = 0 # main函数 split_csv(src_file_name, num, flag, file_encoding)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)