摘要: 比如你只需要提取文件中的手机号,而这些文件的编码都不相同,这时,可以这样: f = open(filename,'r,encoding='utf-8',errors='ignore') content = f.read() #do something with content f.close() 阅读全文
posted @ 2019-10-13 08:59 chenzhigang 阅读(1859) 评论(0) 推荐(0) 编辑
摘要: wget -r -c -nH -np -e robots=off url 最好要加上-e robots=off,否则很多文件可能下载不了。 阅读全文
posted @ 2019-10-13 08:54 chenzhigang 阅读(308) 评论(0) 推荐(0) 编辑