pu369com

2020年1月22日

再次遇到golang乱码问题,用simplifiedchinese解决

摘要: 上篇文章中,抓取网页时,本想匹配其中的汉字。由于出现乱码,只好匹配英文绕过了问题。 原因很简单:该网页没指定utf8,默认应该是GBK 解决办法也很简单:引入 "golang.org/x/text/encoding/simplifiedchinese" 比如原来的代码是 resp, err := t 阅读全文

posted @ 2020-01-22 15:16 pu369com 阅读(2950) 评论(0) 推荐(0) 编辑

纯golang爬虫实战(二)-爬取内网网站信息

摘要: 接上一篇文章https://www.cnblogs.com/pu369/p/12202845.html只讲了原理,抽时间写个了实用版,将员工信息爬取到一个TXT文档中,以便于查询,上代码: //纯golang爬虫 package main import ( "bytes" "fmt" "io/iou 阅读全文

posted @ 2020-01-22 13:12 pu369com 阅读(990) 评论(0) 推荐(0) 编辑

导航