node爬虫使用cheerio解析html()出现乱码问题
自己手动写了一个node爬虫,在使用cheerio解析页面时,通过cheerio的html()获取页面内容,但通过控制台打印出来,却出现“乱码”问题了。
需要注意的是,这里的“乱码”并不是真的乱码,这是HTML实体编码。
解决办法是:在load方法中,加入{decodeEntities:false}即可,
let $ = cheerio.load(html,{decodeEntities:false})
参考地址:https://www.jianshu.com/p/60ae70a1fb88