scrapy框架安装及使用
安装scrapy
安装命令
pip install wheel
pip install twisted
pip install pywin32
pip install scrapy
测试
在终端里录入scrapy指令,没有报错即表示安装成功!
创建项目
创建工程命令
scrapy startproject xxxPro
进入项目
cd xxxPro
在spiders子目录中创建一个爬虫文件
scrapy genspider spiderName www.xxx.com
执行工程命令
scrapy crawl spiderName
应用
项目使用介绍
工程创建完成后项目目录如下
spiderName为爬虫原文件唯一标识
相关处理代码放在spiderName文件中
请求头需要标识的 修改settings配置
实战
我们用太屋网房源网站进行数据分析实战
打印出来的结果是一个Selector对象
我们需要进行处理
我们可以看到现在取出了data值
还有一种写法
总结
分类:
爬虫学习
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具