03 2022 档案
八爪鱼抓取规则的列表元素
摘要:豆瓣图书 https://book.douban.com/tag/%E5%B0%8F%E8%AF%B4?start=40&type=T 1.店里列表元素的左上角,全选列表内容 2.点击选中子元素 3.点击选中全部 4.点击采集数据,修改数据预览中的字段 5.设计翻页 6.保存 7.采集
下载模块式报错
摘要:问题: python中安装包出现Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))………… 解决办法:pip install 模块 -i http://pypi.douban.com/simpl
打开filder之后,网页不能使用
摘要:错误提示: The Fiddler AutoResponder is enabled, but this request did not match any of the listed rules. Because the "Unmatched requests passthrough" optio
Passthrough is not supported, GL is disabled
摘要:添加:chrome_options.add_argument('--disable-software-rasterizer')
时间修改为标准时间
摘要:import datetimeimport reimport timedef time_turn(timenum): if 0 < len((timenum)) < 11 and timenum.isdigit(): timenum = int(timenum) timeArray = time.l
36kr科技频道异步加载
摘要:from lxml import etreeimport timeimport randomfrom selenium import webdriverdriver = webdriver.Chrome()url = 'https://36kr.com/information/technology/
社交媒体关键字查询
摘要:""" author:张鑫 date:2022/02/15 13:14 发布账号昵称、发布账号ID、发布时间、内容、发帖链接、账号主页链接、点赞数、评论数、分享数 运行环境 Chrome浏览器 和 selenium驱动版本一致即可 可自行接入公司数据库 keyword_list = ['tsaiin