第14.14节 爬虫实战准备:csdn博文点赞过程http请求和响应信息分析
如果要对csdn博文点赞,首先要登录CSDN,然后打开一篇需要点赞的文章,如《第14.1节 通过Python爬取网页的学习步骤》按《第14.3节 使用google浏览器获取网站访问的http信息》的方法在点赞文章页面通过F12调出开发者工具。此时回到打开博文页面对文章进行点赞,然后在开发者工具中去获取相关的http请求信息,可以看到内容如下:
可以看到,点赞时浏览器向服务端发送了一个http的get请求,请求的URL地址为:
https://blog.csdn.net/laoyuanpython/phoenix/article/digg?ArticleId=100585881
对应的http请求头信息如下:
经过老猿验证,直接通过浏览器访问https://blog.csdn.net/laoyuanpython/phoenix/article/digg?ArticleId=100585881这个url地址时,在文章已经点赞的情况下,该请求取消点赞,返回响应报文:
{“status”:false,“digg”:0,“bury”:“0”}
在文章未点赞情况下,该请求将点赞文章,返回响应报文:
{“status”:true,“digg”:1,“bury”:“0”}。
这样,我们如果要实现csdn博文自动点赞,只需要模拟浏览器向服务器发送点赞连接,并判断返回结果即可。但为了避免将已经点赞的文章取消点赞,则需要预先判断一下文章是否已经点赞,老猿经过分析文章的html文本内容,发现已经点赞文章的点赞按钮的属性值有“‘hover-box btn-like liked" title=“取消点赞”’”,没点赞按钮的属性值有“" long-height hover-box btn-like " title=“点赞””或“’ low-height hover-box btn-like title=“点赞”’”,可以通过字符串查找或者标签解析来判断文章是否点赞。
老猿Python,跟老猿学Python!
博客地址:https://blog.csdn.net/LaoYuanPython
老猿Python博客文章目录:https://blog.csdn.net/LaoYuanPython/article/details/98245036
请大家多多支持,点赞、评论和加关注!谢谢!