python实现从网站下载文件, 带进度信息

我实现了一个函数, 代码如下:

def download_file_from_url(url, save_path='', callback:callable = None):
    '''
    下载文件, 并保存到save_path指定的位置
    url: 形如'http://www.tdx.com.cn/products/data/data/vipdoc/shlday.zip' 
         或者'http://www.tdx.com.cn/products/data/data/vipdoc/szlday.zip'
    save_path: 保存的目标路径, 形如: 'c:/abc'
    callback: 回调函数, 用于实时报告进度的, void f(context:dict)
        context形如: {}
    '''
    target_filename = url.split('/')[-1]    # 取出url的结尾作为文件名
    if save_path == '': save_path = get_main_path() # 如果没有指定保存路径, 则使用默认路径
    full_path = os.path.join(save_path, target_filename) # 拼接得到全路径
    with requests.get(url, stream=True) as fget:
        # 此时只有响应头被下载
        file_size = int(fget.headers["Content-Length"])
        context = {} # 回调函数上下文信息, 用于记录下载进度
        context['file_name'] = full_path
        context['file_size'] = round(file_size/(1024**2),2) # 单位: Mb
        # 每次读取100k字节
        chunk_size = 100*1024
        file_done = 0
        with open(full_path, "wb") as fw:
            for chunk in fget.iter_content(chunk_size):
                fw.write(chunk)
                file_done += chunk_size
                percent = file_done / file_size
                context['download_size'] = round(file_done/(1024**2),2) # 单位: Mb
                context['download_percent'] = round(percent,2) # 形如: 0.34, 表示百分比进度
                if callback is not None: callback(context) # 回调函数

使用示例
里面具体的网站可以替换为自己需要的:

import Common
# '\r'参数可以使打印信息保持在同一行
def _打印进度(context): print(context,end='\r')
url = 'http://xxx.xxx.xxx/shlday.zip'
Common.download_file_from_url(url,callback=_打印进度)

如下图所示:

posted @ 2023-09-17 11:54 顺其自然，道法自然阅读(189) 评论(0) 编辑收藏举报

刷新页面返回顶部

python实现从网站下载文件, 带进度信息

公告