pu369com

01 2020 档案

纯golang爬虫实战(三)-批量下载保存图片
摘要:网站上有9000多张照片要下载: //一开始参考https://www.jb51.net/article/153275.htm用reader和writer进行io.Copy,但经常是抓取100多个网页后就崩溃了, //原因似乎是输入输出流影响或并发数量影响,代码执行快,输出流写硬盘慢。 //后来参考 阅读全文

posted @ 2020-01-23 16:43 pu369com 阅读(2905) 评论(0) 推荐(0) 编辑

再次遇到golang乱码问题,用simplifiedchinese解决
摘要:上篇文章中,抓取网页时,本想匹配其中的汉字。由于出现乱码,只好匹配英文绕过了问题。 原因很简单:该网页没指定utf8,默认应该是GBK 解决办法也很简单:引入 "golang.org/x/text/encoding/simplifiedchinese" 比如原来的代码是 resp, err := t 阅读全文

posted @ 2020-01-22 15:16 pu369com 阅读(3044) 评论(0) 推荐(0) 编辑

纯golang爬虫实战(二)-爬取内网网站信息
摘要:接上一篇文章https://www.cnblogs.com/pu369/p/12202845.html只讲了原理,抽时间写个了实用版,将员工信息爬取到一个TXT文档中,以便于查询,上代码: //纯golang爬虫 package main import ( "bytes" "fmt" "io/iou 阅读全文

posted @ 2020-01-22 13:12 pu369com 阅读(1003) 评论(0) 推荐(0) 编辑

纯golang爬虫实战(一)
摘要:纯golang爬取内网网站数据 参考https://blog.csdn.net/CrazyJavaPerson/article/details/81871649 难点一:需要登录,参考我的上一篇文章https://www.cnblogs.com/pu369/p/12201707.html,找到POS 阅读全文

posted @ 2020-01-16 19:20 pu369com 阅读(825) 评论(0) 推荐(1) 编辑

如何用chrome浏览器截获和发送POST请求
摘要:平时登录网站时,是在表单中填写用户名、密码,然后用鼠标点击提交。 现在想用程序抓内网网站数据,就得知道向哪个网址POST,POST了什么? 1 参考http://www.imooc.com/wenda/detail/575899,在chrome控制台中,找到Network(网络),找到Filter( 阅读全文

posted @ 2020-01-16 15:59 pu369com 阅读(33305) 评论(1) 推荐(1) 编辑

golang 定时弹出对话框
摘要:参考:https://studygolang.com/articles/2712 阅读全文

posted @ 2020-01-02 12:54 pu369com 阅读(1306) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示