2018年2月3日
摘要: 在爬取内容时,遇到乱码问题。故需对网页内容编码格式做判断,方式大体分为三种:一、从header标签中获取Content-Type=#Charset;二、从meta标签中获取Content-Type=#Charset;三、根据页面内容分析编码格式。 其中一/二方式并不能准确指示该页面的具体编码方式,周 阅读全文
posted @ 2018-02-03 14:59 QABIL 阅读(1479) 评论(0) 推荐(0) 编辑