03 2023 档案
虚拟机内存满了 提示没有理会 关机了第二天开不开机
摘要:链接:https://post.smzdm.com/p/a5g0ez07/
阅读全文
python 字符串编码
摘要:测试网站1:http://www.msxindl.com/tools/unicode16.asp 如 \ud83d\udc15 从Unicode还原 是一只🐕 测试网站2:https://www.toolhelper.cn/EncodeDecode/EncodeDecode 编码:真实字符与二进制
阅读全文
session 用法及post请求data写法
摘要:用Session会保留访问网页的一些信息 ,如 Cookie 更高效 还有一种写法: 原因是源码中session方法 return Session 类 两种写法本质是一样的 报错 400: 成功写法: 或 有时候爬虫需要知道数据的总页数,可以去响应头或者返回数据里面找:
阅读全文
postman post请求
摘要:https://moh.nugmyanmar.org/news-media/ 翻页时 post请求 打开postman 输入请求网址 查看网页载荷 将载荷以key:value的方式输入
阅读全文
不完整的网页xpath
摘要:if page == 1: res = utils.multi_requests(url='https://moh.nugmyanmar.org/news-media/') selector = etree.HTML(res.text) tag_groups = selector.xpath("//
阅读全文
列表不改变顺序去重
摘要:tag_groups_3 = self.generate_groups_1(tag_groups_2,['div > table > tbody > tr > td', 'table > tbody > tr > td', 'div > div','p >img']) 方法一: tag_groups
阅读全文
python存 文件报错
摘要:with open("regulation_news_02.json", "w") as file: file.write(json.dumps(data, indent=2, ensure_ascii=False)) 报错: Traceback (most recent call last): F
阅读全文