Scrapy 专题

  • 安装scrapy
- pip install scrapy 
  • 创建项目并创建spider,跑起来
- scrapy startproject scrapy_demo1
- cd scrapy_demo1
- scrapy genspider baidu baidu.com
- scrapy crawl baidu

  • 报错记录
- AttributeError: moduleOpenSSL.SSL’ has no attribute ‘SSLv3_METHOD’
	- 解决办法:卸载新版,安装旧版即可解决问题
		pip uninstall pyOpenSSL==22.1.0
		pip install pyOpenSSL==22.0.0
		
- module ‘lib‘ has no attribute ‘OpenSSL_add_all_algorithms‘
	- 解决办法: 安装的 cryptography库与你现在的使用的环境不兼容导致的,可能是因为cryptography的版本太高,需要进行降级
		pip install cryptography==38.0.4
		
- ImportError: cannot import name 'HTTPClientFactory' from 'twisted.web.client' (unknown location)
	- 解决办法: Twisted版本太高
		pip install Twisted==20.3.0

  • 配置日志的级别,不然输出太多,不容易看
### settings
......
#----------自定义配置-------#
LOG_LEVEL = 'WARNING' # 配置日志级别
ROBOTSTXT_OBEY = False # 最好False,否则啥都没有
posted @   清安宁  阅读(28)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示