09 2021 档案

摘要:当python爬虫遇到html不规则怎么办? 比如爬取微博个人信息,在这给大家讲一个小技巧 https://weibo.com/a1937000700?is_hot=1 需要解析html提取个人信息 ###第一步、在pycharm 新建HTML file ###第二步、复制html中的元素到新建HT 阅读全文
posted @ 2021-09-24 09:40 莫贞俊晗 阅读(57) 评论(0) 推荐(0) 编辑
摘要:有个需求爬取知乎文章,正好记录下爬取过程以及出现问题并解决方法 我是在没有登录的情况下爬取文章的 本文仅供研究与学习使用 知乎现今的 x-zse 参数的加密方法已升级成了:x-zse-96 2.0版本。 来看这篇帖子的应该都知道,这个参数动态唯一,没有就拿不到api数据。 查阅了网上有关文章,仅有x 阅读全文
posted @ 2021-09-16 11:19 莫贞俊晗 阅读(1268) 评论(0) 推荐(0) 编辑
摘要:如果遇到参数请求没有返回结果,很可能是参数格式问题,可以用以下方法处理 data=json.dumps(params, separators=()) ###例1 import json json.dumps([1,2,3,{'4': 5, '6': 7}], separators=(',',':') 阅读全文
posted @ 2021-09-10 17:19 莫贞俊晗 阅读(1086) 评论(0) 推荐(0) 编辑
摘要:###1 读取json文件报错 https://blog.csdn.net/qq_32526087/article/details/106317051 json.decoder.JSONDecodeError: Invalid control character at: line 1 column 阅读全文
posted @ 2021-09-08 11:33 莫贞俊晗 阅读(457) 评论(0) 推荐(0) 编辑