摘要:
用Session会保留访问网页的一些信息 ,如 Cookie 更高效 还有一种写法: 原因是源码中session方法 return Session 类 两种写法本质是一样的 报错 400: 成功写法: 或 有时候爬虫需要知道数据的总页数,可以去响应头或者返回数据里面找: 阅读全文
2023年3月14日
摘要:
https://moh.nugmyanmar.org/news-media/ 翻页时 post请求 打开postman 输入请求网址 查看网页载荷 将载荷以key:value的方式输入 阅读全文
2023年3月13日
摘要:
if page == 1: res = utils.multi_requests(url='https://moh.nugmyanmar.org/news-media/') selector = etree.HTML(res.text) tag_groups = selector.xpath("// 阅读全文
2023年3月6日
2023年3月2日
摘要:
with open("regulation_news_02.json", "w") as file: file.write(json.dumps(data, indent=2, ensure_ascii=False)) 报错: Traceback (most recent call last): F 阅读全文
2023年2月14日
2023年2月1日
2023年1月31日
2023年1月28日
2023年1月6日
摘要:
python访问excel链接,读取内容 res_url = ‘https://dispozitive.anm.ro/f1f2-display’ res = requests.get(res_url, timeout=60) selector = etree.HTML(res.text) xls_l 阅读全文