01 2024 档案
摘要:使用selenium+Browsermob-Proxy实现付费爬取。(付费爬取需要有vip账号) selenium负责实现自动化模拟点击,Browsermob-Proxy抓取请求。 分析 首先打开qq音乐网址,搜索歌曲(这里歌曲名使用了UrlEncode编码了),:https://y.qq.com/
阅读全文
摘要:处理短信验证码的思路就是手机端有一个可以转发短信到我们可以读取的地方。目前我的处理方式是将短信转发到邮箱,再读取邮箱中的邮件拿取验证码。 首先就需要下载转发工具:https://github.com/pppscn/SmsForwarder/releases/tag/v3.2.0 具体使用参考官方
阅读全文
摘要: 在高并发的情境下,库存超卖成为了一个常见的问题。同时,为了提升用户体验和确保交易的公平性,实现一人一单的功能也变得至关重要。 建表 创建商品表和订单表 CREATE TABLE `goods` ( `id` int NOT NULL, `name` varchar(50) CHARACTER S
阅读全文
摘要:布隆过滤器数据结构 本质上布隆过滤器是一种特殊的数据结构,特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”。 布隆过滤器是一个 bit 向量或者说 bit 数组: 我们要映射一个值到布隆过滤器中,需要使用多个不同的哈希函数生成多个哈希值,并对每个生成的哈希值置为1指向的bi
阅读全文