03 2023 档案

职友集 查工资
摘要:职友集官网:https://www.jobui.com/salary/guangzhou-yunweigongchengshi/ 阅读全文
posted @ 2023-03-29 16:09 明媚的夏午 阅读(332) 评论(0) 推荐(0) 编辑
虚拟机内存满了 提示没有理会 关机了第二天开不开机
摘要:链接:https://post.smzdm.com/p/a5g0ez07/ 阅读全文
posted @ 2023-03-29 13:03 明媚的夏午 阅读(28) 评论(0) 推荐(0) 编辑
python 字符串编码
摘要:测试网站1:http://www.msxindl.com/tools/unicode16.asp 如 \ud83d\udc15 从Unicode还原 是一只🐕 测试网站2:https://www.toolhelper.cn/EncodeDecode/EncodeDecode 编码:真实字符与二进制 阅读全文
posted @ 2023-03-15 14:30 明媚的夏午 阅读(150) 评论(0) 推荐(0) 编辑
session 用法及post请求data写法
摘要:用Session会保留访问网页的一些信息 ,如 Cookie 更高效 还有一种写法: 原因是源码中session方法 return Session 类 两种写法本质是一样的 报错 400: 成功写法: 或 有时候爬虫需要知道数据的总页数,可以去响应头或者返回数据里面找: 阅读全文
posted @ 2023-03-14 16:46 明媚的夏午 阅读(151) 评论(0) 推荐(0) 编辑
postman post请求
摘要:https://moh.nugmyanmar.org/news-media/ 翻页时 post请求 打开postman 输入请求网址 查看网页载荷 将载荷以key:value的方式输入 阅读全文
posted @ 2023-03-14 15:26 明媚的夏午 阅读(29) 评论(0) 推荐(0) 编辑
不完整的网页xpath
摘要:if page == 1: res = utils.multi_requests(url='https://moh.nugmyanmar.org/news-media/') selector = etree.HTML(res.text) tag_groups = selector.xpath("// 阅读全文
posted @ 2023-03-13 11:23 明媚的夏午 阅读(32) 评论(0) 推荐(0) 编辑
列表不改变顺序去重
摘要:tag_groups_3 = self.generate_groups_1(tag_groups_2,['div > table > tbody > tr > td', 'table > tbody > tr > td', 'div > div','p >img']) 方法一: tag_groups 阅读全文
posted @ 2023-03-06 14:58 明媚的夏午 阅读(16) 评论(0) 推荐(0) 编辑
python存 文件报错
摘要:with open("regulation_news_02.json", "w") as file: file.write(json.dumps(data, indent=2, ensure_ascii=False)) 报错: Traceback (most recent call last): F 阅读全文
posted @ 2023-03-02 12:00 明媚的夏午 阅读(33) 评论(0) 推荐(0) 编辑

 
点击右上角即可分享
微信分享提示