摘要: 自己手动写了一个node爬虫,在使用cheerio解析页面时,通过cheerio的html()获取页面内容,但通过控制台打印出来,却出现“乱码”问题了。 需要注意的是,这里的“乱码”并不是真的乱码,这是HTML实体编码。 解决办法是:在load方法中,加入{decodeEntities:false} 阅读全文
posted @ 2020-04-21 21:43 兔子先生i 阅读(1374) 评论(0) 推荐(0) 编辑