摘要: 在 Node 层利用 cheerio 解析网页时,输出的中文内容都是以 &#x 开头的一堆像乱码一样的东西,尝试过各种编码都无效,而且神奇的是,将这一堆“乱码”保存成网页后,通过浏览器打开又可以正常显示。这到底是什么👻?? 缩减后的示例代码如下: 其实,上面那一堆乱码一样的东西,它的学名叫实体编码 阅读全文
posted @ 2018-12-20 23:16 大炮~ 阅读(5800) 评论(0) 推荐(2) 编辑