Scrapy安装和项目创建
### 安装说明
scrapy安装需要安装一些第三方依赖库,依赖库的安装与需要和Python版本,Windows位数,所需的电脑插件有关。
参考信息:Python3.6,Windows10 64位
相关软件下载:
链接:https://pan.baidu.com/s/1Vzx8GGeojmUzMSZExJac4w
提取码:jv54
环境准备
安装 Microsoft Visual C++ 14.0
升级pip版本
Python pip install --upgrade pip --force-reinstall
安装第三方库(CMD命令)
在线安装
使用默认镜像网址安装(下载较慢) pip install 库名
使用豆瓣镜像安装 pip --default-timeout=100 install 库名 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
离线安装
Python第三库下载网址:https://www.lfd.uci.edu/~gohlke/pythonlibs/
安装解析离线库的第三方库 pip --default-timeout=100 install wheel -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip install 本地离线库完整路径(不能有中文)
安装scrapy所需的库
pip --default-timeout=100 install requests -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip --default-timeout=100 install lxml -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip --default-timeout=100 install pyOpenSSL -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip --default-timeout=100 install Twisted -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip --default-timeout=100 install pywin32 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip --default-timeout=100 install scrapy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
创建爬虫项目
打开CMD 进入需要创建项目的文件夹 创建项目 scrapy startproject 项目名
使用Pycharm打开项目
自动生成爬虫文件
打开Pycharm自带的CMD输入 baiduSpider:爬虫名 www.baidu.com:爬取的网站 Scrapy genspider baiduSpider www.baidu.com
运行爬虫项目
通过命令运行
baiduSpider:爬虫名 scrapy crawl baiduSpider
使用Python脚本运行
在spiderDM目录创建一个Run.py文件输入如下代码
from scrapy import cmdline cmdline.execute("scrapy crawl baiduSpider".split(" "))
运行Run.py文件就可以运行 baiduSpider爬虫
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一次Java后端服务间歇性响应慢的问题排查记录
· dotnet 源代码生成器分析器入门
· ASP.NET Core 模型验证消息的本地化新姿势
· 对象命名为何需要避免'-er'和'-or'后缀
· SQL Server如何跟踪自动统计信息更新?
· 官方的 MCP C# SDK:csharp-sdk
· 一款 .NET 开源、功能强大的远程连接管理工具,支持 RDP、VNC、SSH 等多种主流协议!
· 提示词工程师自白:我如何用一个技巧解放自己的生产力
· 一文搞懂MCP协议与Function Call的区别
· 如何不购买域名在云服务器上搭建HTTPS服务