基于node.js的医院挂号页面爬虫

背景

TM的牙疼,想挂一个九院的专家,拔个牙。结果每天早起抢号都没抢到过。于是乎,就想通过捡漏的办法,24小时不间断请求医院挂号页面,看有没有专家放号。一旦检测到放号,就立即发邮件,发短信通知我。我立刻去挂号。(之所以没开发自动挂号功能,一是担心我身份证被医院拉黑,二是可能涉及到敏感问题会被叫去喝茶)

实现

想法一

找到医院挂号页面,直接f12抓接口,分析接口获取到可预约医生名单
image
image

结论

失败。原因如下:
1、每个接口都做了签名校验,根本无法知道签名生成规则
2、请求参数全部加密了,无法知道私钥

想法二

调用第三方库,模拟人打开页面。获取到所有的dom元素,然后分析dom元素,获取到可预约医生名单

结论

成功!!!
详细代码不便透露,但是可给一个参考仓库。我是基于这个仓库实现的。仓库地址:https://github.com/qinyuanqiblog/house.git

按README.md下载依赖运行即可,如觉得安装mysql麻烦,可以把mysql部分全部注释掉。对于捡漏挂号这个项目来说,无需用到数据库。

posted @ 2024-07-09 18:44  菜鸟小何  阅读(3)  评论(0编辑  收藏  举报