会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
PYTHON & ODOO
QQ:553490191
管理
2017年6月19日
python 解决抓取网页中的中文显示乱码问题
摘要: 关于爬虫乱码有很多各式各样的问题,这里不仅是中文乱码,编码转换、还包括一些如日文、韩文 、俄文、藏文之类的乱码处理,因为解决方式是一致的,故在此统一说明。 网络爬虫出现乱码的原因 源网页编码和爬取下来后的编码格式不一致。如源网页为gbk编码的字节流,而我们抓取下后程序直接使用utf-8进行编码并输出
阅读全文
posted @ 2017-06-19 13:52 553490191
阅读(10019)
评论(0)
推荐(0)
编辑