拆分文本文件

# -*- coding: utf-8 -*-

import os
import pandas as pd


def split_csv(src_file_name, num, flag, file_encoding):
    df = pd.read_csv(src_file_name, encoding='gbk')
    # total_num，原始文件总行数；num_tmp根据num计算出文件个数或每个文件行数
    total_num = df.shape[0]
    num_tmp = float(total_num / num)
    # 算出有小数时，加1
    if int(num_tmp) < num_tmp:
        num2 = int(num_tmp) + 1
    else:
        num2 = int(num_tmp)
    # print(num2)

    if flag == 0:
        pass
    elif flag == 1:
        # 原始脚本是当flag ==0 时设计的；当为1时，交换一下参数
        num, num2 = num2, num

    print(num, num2, total_num)

    # 文件名和扩展名分开
    f_name, f_extension = os.path.splitext(src_file_name)

    for i in range(1, num2 + 1):
        df.iloc[(i - 1) * num:i * num].to_csv(
            f"{f_name}{i}{file_encoding}{f_extension}",
            index=False,
            encoding=file_encoding)
        print(i)


if __name__ == '__main__':
    # 设置原始数据名称
    src_file_name = '银行交易流水.txt'
    # 设置结果每个文件数据行数
    num = 10000
    # 设置结果文件编码格式
    file_encoding = 'utf-8'
    # flag：0：num为每个文件的行数；1：num为分成文件数
    flag = 0
    # main函数
    split_csv(src_file_name, num, flag, file_encoding)

posted @ 2023-06-18 11:06 你说夕阳很美阅读(18) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· excel一个sheet拆分成几个文件

· 跟据sheet名拆分Excel文件

· Python利用pandas拆分大型的csv文件

· excel多行提示词转单行并拆分

· 一个 python 拆解文本文件的工具

阅读排行：
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码，我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了
· 上周热点回顾（2.24-3.2）

公告

昵称：你说夕阳很美
园龄： 6年2个月
粉丝： 1
关注： 5

+加关注

2025年3月

日

一

二

三

四

五

六

daizichuan

拆分文本文件

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

最新评论