摘要: 第六章 读取文档 一、纯文本 处理 HTML 页面的时候,网站其实会在 <head> 部分显示页面使用的编码格式。大多数网站,尤其是英文网站,都会带这样的标签: <meta charset="utf-8" /> 如果你要做很多网络数据采集工作,尤其是面对国际网站时,建议你先看看 meta 标签的内容 阅读全文
posted @ 2019-07-01 10:45 椰汁软糖 阅读(186) 评论(0) 推荐(0) 编辑