Python抓取远程文件获取真实文件名

用urllib下载远程文件并转存到hdfs服务器,在下载时,下载地址中不一定包含文件名,需要从连接信息中获取。

复制代码
 1     file_url = request.form.get('file_url')
 2     fo = urllib.urlopen(file_url)
 3     blob = fo.read()
 4     file_size = len(blob)
 5     if fo.info().has_key('Content-Disposition'):
 6         file_name = fo.info()['Content-Disposition'].split('filename=')[1]
 7         file_name = file_name.replace('"', '').replace("'", "")
 8         print '-in header'
 9     else:
10         file_name= os.path.basename(file_url)
11         
12     file_ext = get_file_ext(file_name.lower())
13     remark = request.form.get("remark", '')
14     # 存储到hdfs
复制代码

 

posted @   万里沙来手一挥  阅读(3463)  评论(0编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 记一次.NET内存居高不下排查解决与启示
历史上的今天:
2016-03-26 解决VMware下安装Ubuntu15不支持1920X1080分辨率的问题
点击右上角即可分享
微信分享提示