北风之神0509

反对极端面向过程编程思维方式，喜欢面向对象和设计模式的解读，喜欢对比极端面向过程编程和oop编程消耗代码代码行数的区别和原因。致力于使用oop和36种设计模式写出最高可复用的框架级代码和使用最少的代码行数完成任务，致力于使用oop和设计模式来使部分代码减少90%行，使绝大部分py文件最低减少50%-80%行的写法。

获取任意网页的编码格式

如果是非定向爬虫，不是专门爬一个固定位置的信息，而是成千上万的未知网站，那就需要找到编码格式了，使用如下正则，可以正确找到,准确率99%
content=requests.get(url).content
bianma_group=re.search('<meta[\s\S]*?charset="?([a-zA-Z0-9\-]*)', respbody0, re.IGNORECASE)

if bianma_group:
    print bianma_group.group(1)

posted @ 2017-08-07 14:16 北风之神0509 阅读(541) 评论(0) 收藏举报

刷新页面返回顶部