python压缩包模块zipfile、rarfile

五种压缩文件对比

python压缩包操作依赖于本地的解压缩软件,所以不要指望rar工具会解压zip文件,反之亦然。

以下列出五种压缩文件

类型 模块 说明
gz gizp 通常仅仅能压缩一个文件。与tar结合起来就能够实现先打包,再压缩。
tar tarfile linux系统下的打包工具。仅仅打包。不压缩
tgz gizp、tarfile 即tar.gz。先用tar打包,然后再用gz压缩得到的文件
zip zipfile 不同于gzip。尽管使用相似的算法,能够打包压缩多个文件。只是分别压缩文件。压缩率低于tar。
rar rarfile 打包压缩文件。最初用于DOS,基于window操作系统。

需要解压哪种就import哪个模块,本节主要介绍一下zip和rar。

ZIPfile

help(zipfile)zipfile是内置模块,文档和官方的使用说明都很齐全。
常用方法

import zipfile


class MZipFile(object):
    '''
    python zipfile 模块处理压缩文件并读取包里面的每个文件内容(行)
    '''

    def __init__(self, zip_path):
        '''
        :param zip_path: zip文件路径
        '''
        self.zip = zipfile.ZipFile(zip_path, 'r')  # 创建一个zipfile

    def get_filecount(self):
        '''
        :return: 返回压缩包里面的文件个数
        '''
        return len(self.zip.namelist())

    def get_one_file(self):
        '''
        :return: 创建一个generator ,每次返回一个文件的内容
        '''
        for name in self.zip.namelist():
            yield self.read_lines(name)  # 生成器

    def read_lines(self, name):
        '''
        :param name: 文件名
        :return: 整个文件所有行(列表:每一行作为一个元素)
        '''
        return [line.decode() for line in self.zip.open(name).readlines()]

    def get_filenames(self):
        '''
        :return:  返回自拍zip文件里面的所有文件名(列表:每个文件名作为一个元素)
        '''
        return self.zip.namelist()

    def extract_to(self, path):
        '''
        解压zip 文件
        :param path: 解压路径
        '''
        self.zip.extractall(path)
        return path


'''
Examples
'''
if __name__ == "__main__":
    zip = MZipFile(zip_path="123.zip")
    print("文件个数:", zip.get_filecount())
    print("文件名列表:", zip.zip.namelist())
    print("各个文件内容:", str(list(zip.get_one_file())))
    print("解压的路径:", zip.extract_to("./test"))

rarfile

刚才说到zipfile是内置模块,相比之下rarfile的文档相当少,而且会有跨平台的问题。好在他是仿照zipfile写的,所以接口和zipfile一致。
也就说zipfile的所有接口,到rarfile里也可以用。

查看压缩包文件个数

import rarfile

rarfile_ = rarfile.RarFile(r'C:\Users\zhaobw\Desktop\测试.zip')
mylist = rarfile_.namelist()
for i in mylist:
    print(i)
posted @ 2020-07-29 14:48  名字很长容易被惦记  阅读(3521)  评论(0编辑  收藏  举报