摘要: 总所周知,对于python而言实现tcp/udp的传输一般靠的是socket这个库,而区分两者的是建立socket的参数 SOCK_STREAM 为TCP连接 SOCK_DGRAM 为UDP连接 而一般情况下接收报文需要遵从某一些协议,这样双方可以通过特定的粘包解包操作处理数据。 很多情况自定义协议 阅读全文
posted @ 2020-05-09 10:45 上周的bug还没搞好 阅读(1425) 评论(0) 推荐(0)
摘要: 见多了前端各种js的混淆,参数的加密,虽然抓包会拿到最后的结果,但是一步步分析是真的折磨人,像一些恶心的sojson混淆,可能会让人看着各种参数而头皮发麻。 这里分享一些常用的hook js的方法,与反爬一起进步! //hook window对象的__pt__属性的设置与取值(function(){ 阅读全文
posted @ 2020-03-03 10:21 上周的bug还没搞好 阅读(503) 评论(0) 推荐(0)
摘要: 爬虫经常出现错误,多半是没等待控件加载出来。利用selenium虽然方便,但是还是需要控制一下等待时间。Selenium有两个常见的模块来控制等待。EC(expected_conditions)EC作为预期条件,... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(761) 评论(0) 推荐(0)
摘要: 本文只是提供一些经验,实际情况下因地制宜。自己做了个Django项目,缓存用的是redis,部署到云服务器上,想要通过爬虫自动化注册账号。话不多说,一步步做。首先要准备账号数据,chorme利用ctrl+shif... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(320) 评论(0) 推荐(0)
摘要: 后端到前端普通的字典传递exam_list = ExamList.objects.filter(id=exam_id)title = exam_list[0]return render(request, "exa... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(135) 评论(0) 推荐(0)
摘要: bytes 转换为 strstr(b, encoding = "utf-8") str(b, encoding = "gbk") encoding中写的是原来byte变量的编码 什么类型的编码的字节就要转换... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(772) 评论(0) 推荐(0)
摘要: 本文仅作经验分享,不做商业用途,如涉及权利问... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(2038) 评论(3) 推荐(0)
摘要: 对于爬虫而言验证码是一定要经过的坎,对于网站... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(267) 评论(0) 推荐(0)
摘要: 之前用scrapy爬取网页时经常出现需要验证码,但是返回的是个response对象,不知道要如何进行破解。以往都是selenium进行截图验证码,模拟拖动,但是scrapy在yield请求后就直接走了,不知道如何... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(797) 评论(0) 推荐(0)
摘要: 本文旨在经验交流,如若侵犯利益,请联系删除。2019.09.10下面的例子已经改为阿里的人机认证了,但是其实用selenium启动浏览器后,依旧可以用pynput来操控键鼠来完成模拟操作,单纯调用send_key... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(7375) 评论(3) 推荐(1)