上一页 1 2 3 4 5 6 7 8 9 ··· 14 下一页
摘要: 本节目标:图片验证码识别 + 其他 1.图片验证码 在很多登录、注册、频繁操作等行为时,一般都会加入验证码的功能。 如果想要基于代码实现某些功能,就必须实现:自动识别验证码,然后再做其他功能。 2.识别 基于Python的模块 ddddocr 可以实现对图片验证码的识别。 pip3.11 insta 阅读全文
posted @ 2024-02-11 09:49 凫弥 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 今日目标:对北大未名BBS进行逆向,实现账号登录 提示:入门级别的js逆向案例。 1.关于js逆向 在页面上输入的密码:woshiniba,但是提交后密码居然变成:c739492f2837ed5c6927914a55467874。 这其实是,在网页中的JS代码在发送请求之前,对我们的密码进行了处理( 阅读全文
posted @ 2024-02-11 09:49 凫弥 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 本节目标:实现xx军事网账号的自动登录 1.前置知识点 在开始实现之前,需要先学一些必备的前置知识。 1.1 页面刷新抓包 在抓包时,如果有页面刷新,之前的请求包就会被清除(无法分析)。 1.2 表单请求和ajax请求 当看到页面上有一个表单时,当输入账号+点击登录/注册提交,数据提交就两种方式: 阅读全文
posted @ 2024-02-11 09:48 凫弥 阅读(14) 评论(0) 推荐(0) 编辑
摘要: 本节概要:如何提取嵌入在HTML格式中的文本信息。 很多网站请求后,返回的数据是嵌套在HTML格式中的。例如:5xclass.cn 对于这种情况想要提取其中的数据,常见有两种方法: 基于bs4模块(本节重点) 基于xpath模块 1.HTML格式 <div> <h1 class="item">武沛齐 阅读全文
posted @ 2024-02-11 09:48 凫弥 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 本节来学爬虫使用requests模块的常见操作。 1.URL参数 无论是在发送GET/POST请求时,网址URL都可能会携带参数,例如:http://www.5xclass.cn?age=19&name=wupeiqi res = requests.get( url="https://www.5xc 阅读全文
posted @ 2024-02-11 09:47 凫弥 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 1. 什么是爬虫? 用代码代替人去模拟浏览器或手机去执行执行某些操作。 例如: 自动登录钉钉,定时打卡 去91自动下载图片/视频 去京东抢茅台 3.分析&模拟 分析一个网址,用requests请求就可以实现。 3.1 请求分析 基于谷歌浏览器去分析。 3.2 模拟请求 基于requests模块发送请 阅读全文
posted @ 2024-02-11 09:46 凫弥 阅读(42) 评论(0) 推荐(0) 编辑
摘要: 1.获取图片 # @课程 : 爬虫逆向实战课 # @讲师 : 武沛齐 # @课件获取: wupeiqi666 import re import time import ddddocr import requests from selenium import webdriver from seleni 阅读全文
posted @ 2024-02-11 09:22 凫弥 阅读(193) 评论(0) 推荐(0) 编辑
摘要: 基于selenium实现过滑块验证核心需要三步: 获取验证码图片 识别图片,计算轨迹距离 寻找滑块,控制滑动 1.获取图片 https://www.geetest.com/adaptive-captcha-demo 示例1: import re import time from selenium i 阅读全文
posted @ 2024-02-11 09:20 凫弥 阅读(52) 评论(0) 推荐(0) 编辑
摘要: 1.selenium自动化 selenium可以操作浏览器,在浏览器页面上实现:点击、输入、滑动 等操作。 不同于selenium自动化,逆向本质是: 分析请求,例如:请求方法、请求参数、加密方式等。 用代码模拟请求去实现同等功能。 逆向 vs 自动化Selenium Selenium,【优】简单不 阅读全文
posted @ 2024-02-11 09:13 凫弥 阅读(42) 评论(0) 推荐(0) 编辑
摘要: 基于 **C语言源码 ** 底层,让你真正了解垃圾回收机制的实现。 引用计数器 标记清楚 分代回收 缓存机制 Python的C源码(3.8.2版本) 1. 引用计数器 1.1 环状双向链表 refchain 在python程序中创建的任何对象都会放在refchain链表中。 name = "武沛齐" 阅读全文
posted @ 2024-01-28 17:41 凫弥 阅读(9) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 14 下一页