node爬虫使用cheerio解析html()出现乱码问题

自己手动写了一个node爬虫,在使用cheerio解析页面时,通过cheerio的html()获取页面内容,但通过控制台打印出来,却出现“乱码”问题了。

 

需要注意的是,这里的“乱码”并不是真的乱码,这是HTML实体编码。

解决办法是:在load方法中,加入{decodeEntities:false}即可,

let $ = cheerio.load(html,{decodeEntities:false})

参考地址:https://www.jianshu.com/p/60ae70a1fb88

 

posted @ 2020-04-21 21:43  兔子先生i  阅读(1416)  评论(0编辑  收藏  举报