摘要: 需求: 第一次访问金华房网(https://www.0579fw.com/)需要进行滑块校验,经过判断此验证码为阿里云验证码,但不同于12306、淘宝的验证码校验,现需要对网站滑块进行验证码破解并获取相应的cookie进行网站数据的采集,滑块样式如下: 1. 分析验证码来源 经过抓包分析验证码来源于 阅读全文
posted @ 2022-05-18 19:06 Dog.泰迪 阅读(2231) 评论(0) 推荐(0) 编辑
摘要: 需求1: 有多个linux文件,需要查找那个文件中包含指定的字符串的文件名 命令: grep -ril "指定的字符串" * 需求2: 查找根目录下的文件包含指定的字符串的对应内容 命令: find / -name "*" | xargs grep -i "指定的字符串" 阅读全文
posted @ 2022-05-16 15:43 Dog.泰迪 阅读(819) 评论(0) 推荐(0) 编辑
摘要: 逆向介绍: 通过对https://qimingpian.cn/finosda/project/pinvestment页面进行爬取,发现网站数据对返回的接口数据进行了加密处理,加密处理内容如下: 1.定位数据来源 对网站https://qimingpian.cn/finosda/project/pin 阅读全文
posted @ 2022-05-13 16:41 Dog.泰迪 阅读(64) 评论(0) 推荐(0) 编辑
摘要: 逆向介绍 通过对https://sz.58.com/searchjob/?pts=1641212057373页面进行爬取,发现网站部分敏感信息存在字体加密,字体加密情况如下: 1.获取网站源代码进行分析 通过分析发现字体库存在网页源代码当中: 进过对网站多次刷新发现每一次网站的这一段代码都会发生变化 阅读全文
posted @ 2022-01-18 18:02 Dog.泰迪 阅读(452) 评论(0) 推荐(0) 编辑
摘要: 查看所有环境 conda info --envs 新建虚拟环境 conda create -n env_name python=3.x 删除虚拟环境 conda remove -n env_name --all 激活虚拟环境 conda activate env_name 退出虚拟环境 conda 阅读全文
posted @ 2021-03-11 15:09 Dog.泰迪 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 1.安装python3及相关依赖 yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqlite-devel gcc gcc-c++ openssl-devel zlib zlib-devel py 阅读全文
posted @ 2020-12-10 17:41 Dog.泰迪 阅读(264) 评论(0) 推荐(0) 编辑
摘要: python selenium过淘宝所有验证 阅读全文
posted @ 2020-12-09 15:30 Dog.泰迪 阅读(3345) 评论(1) 推荐(0) 编辑
摘要: 使用pymysql提交数据 在使用pymysql进行提交数据的时候,必须使用事务进行提交,代码如下: import pymysql # 连接数据库 db = pymysql.connect( host = 'ip', port = port, user = 'root', password = 'r 阅读全文
posted @ 2020-12-08 10:40 Dog.泰迪 阅读(1104) 评论(0) 推荐(0) 编辑
摘要: 原因: selenium在运行会出现一些预定义的javascript变量(特征字符串),例如:"window.navgator,webdriver",在非selenium变量下的值为undefined,但是在selenium环境下,其职为true,不同的属性可以参考:https://blog.csd 阅读全文
posted @ 2020-11-30 17:05 Dog.泰迪 阅读(388) 评论(0) 推荐(0) 编辑
摘要: 1. 通过抓包工具发现,station.name.js这个js文件存储了所有的车站信息, 经过对请求头的分析,发现请求的url为:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.91 阅读全文
posted @ 2020-11-30 09:06 Dog.泰迪 阅读(558) 评论(0) 推荐(0) 编辑