[python IO学习篇] [打开包含中文路径的文件]

https://my.oschina.net/mcyang000/blog/289460
 
打开路径含有中文的文件时,要注意:
1 在windows对文件名编码是采用gbk等进行编码保存,所以要将文件路径先解码,在按gbk编码: 
字符串--解码成unicode--编码(注意str和unicode的转换)

with open(r"D:\我的文档\桌面\python\config.ini".decode('utf8').encode('gbk'),'rb') as f:
print f.read()

 
或者采用
#coding=utf-8 #当然这里要在前面设置系统的编码方式
with open(ur"D:\我的文档\桌面\python\config.ini".encode('gbk'),'rb') as f:  
 
或者with open(ur"D:\我的文档\桌面\python\config.ini",'rb') as f:
 
 
 
 
 
摘要: 在windows使用gbx(gb2312,gbk,gb18030我也不知道是哪个)对文件名及文件路径进行编码保存。打开文件的函数中使用诸如open(filename.encode('gbk'))可以很好的解决。另外路径分隔符要写Unix风格的'/',不要写'\'

windows使用gbx(gb2312,gbk,gb18030我也不知道是哪个)对文件名及文件路径进行编码保存。打开文件的函数中使用诸如open(filename.encode('gbk'))可以很好的解决。

 

#coding:utf8

if __name__  == '__main__':
    srcfile = r"D:/测试路径/测试文件.txt"
    f = open(srcfile.decode('utf8').encode('gbk'))
    for text in f.readlines():
        print text.decode('gbk')
    f.close()

或者:

#coding:utf8

if __name__  == '__main__':
    srcfile = u"D:/测试路径/测试文件.txt"
    f = open(srcfile.encode('gbk'))
    for text in f.readlines():
        print text.decode('gbk')
    f.close()
上述两种方法均可。

另外,不要下面被这句话干扰:

print text.decode('gbk')
它只表示文件内容是用gbk编码的。更多内容可见 http://my.oschina.net/iuranus/blog/262914 

补充说明:这里这样写也是可以打开的:

srcfile = u"D:/测试路径/测试文件.txt"
    f = open(srcfile)
但是在使用opencv库时,cv2.imread(srcfile),srcfile必须以gbk编码(srcfile.encode('gbk'))才能打开,同时要注意是unix风格的'/',而不是'\'。

 

posted @ 2017-06-18 13:07  liuzhipenglove  阅读(6305)  评论(0编辑  收藏  举报