随笔分类 -  爬虫那事

PyExecJs包的使用
摘要:pyexecjs是一个用Python来执行JavaScript代码的工具库。 一、pyexecjs: pyexecjs是一个用Python来执行JavaScript代码的工具库,该库支持多种JavaScript运行时环境,如Node.js、PhantomJS、SlimerJS等,允许开发者在Pyth 阅读全文

posted @ 2024-08-27 15:03 一先生94 阅读(125) 评论(0) 推荐(0) 编辑

在爬虫过程中出现乱码,那么如何处理?
摘要:在爬虫中很容易出现乱码现象,那么具体如何处理呢?以下有几种方式,记录下。 方式一:给响应对象添加encoding response = request.get(url=url,headers=headers) response.encoding = "utf-8" 或者手动指定网页编码: # 手动设 阅读全文

posted @ 2022-12-11 14:13 一先生94 阅读(394) 评论(0) 推荐(0) 编辑

lxml.etree.XMLSyntaxError: Opening and ending tag mismatch: meta line 6 and head, line 8, column 8
摘要:在使用xpath,遇到了报错,记录下。 (python中代码是没有问题) from lxml import etree import requests from constants import headers def run(): # url = "http://www.gushiju.net/s 阅读全文

posted @ 2022-12-10 17:38 一先生94 阅读(344) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示