CSS Ribbon

Reproducing the GitHub Ribbon in CSS

Fork me on GitHub

【路飞学城第七模块考核】

一． Requests模块
1. 1. 简述爬虫的概念
2. 2. 爬虫有几种分类，在使用场景中
3. 3. 简述robots协议的概念也作用
4. 4. 什么是反爬机制和反反爬机制
5. 5. 简述使用requests模块进行数据爬取的大致流程
6. 6. 简述使用requests模块爬取ajax加载数据爬取的大致流程
7. 7. 简述User-Agent参数的作用
8. 8. 在requests模块中接触过哪些反爬机制
9. 9. 介绍下requests模块中get和post方法常用参数的作用
10. 10. 简述session的创建流程及其该对象的作用
11. 11. 简述如何使用requests模块进行模拟登录，并抓取登录成功后的某个二级页面数据。
12. 12. 简述如何使用requests模块设置代理IP
二．数据解析
1. 1. 简述使用在使用正则进行解析时用到的re.S和re.M的作用和区别
2. 2. 简述如何使用xpath进行数据解析
3. 3. 简述如何使用bs4进行数据解析
4. 4. xpath方法返回值类型是什么
5. 5. 在xpath中如何/text()和//text()的区别是什么
6. 6. id为su的div标签有一个子标签ul，ul下有十个li标签，每一个li标签下都有一个a标签，如何编写xpath表达式可以解析到a标签的href属性值

　　　　　　7. class为wd的div标签有一个子标签ul，ul下有十个li标签，每一个li标签下都有一个a标签，如何编写xpath表达式可以解析到a标签中的文本内容

　　　　　　8. 简述BeautifulSoup模块中find和findall方法的区别

　　　　　　9. 简述BeautifulSoup模块中select方法的使用

　　　　　　10. 简述xpath插件的作用

三． Scrapy框架
1. 1. 简述scrapy框架的安装流程
2. 2. scrapy中持久化操作有几种形式，分别如何实现？
3. 3. 简述start_requests方法的作用
4. 4. 如何进行post请求发送，在scrapy中
5. 5. 如何手动进行一个get请求的发送，在scrapy中
6. 6. 简述管道文件的作用
7. 7. 简述Request方法中callback参数的作用
8. 8. 简述Request方法中meta参数的作用
9. 9. 简述下载中间件的作用
10. 10. 简述如何设置scrapy项目的代理IP
11. 11. 简述CrawlSpider中链接提取器的作用
12. 12. 简述CrawlSpider中规则解析器的作用
13. 13. 简述scrapy核心组件的工作原理
14. 14. 原生scrapy框架为何不能实现分布式
15. 15. 简述基于scrapy-redis分布式的流程

posted on 2018-11-28 08:02 pandaboy1123 阅读(511) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· SQL Server 2025 AI相关能力初探
· Linux系列：如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？
· 开源Multi-agent AI智能体框架aevatar.ai，欢迎大家贡献代码
· Manus重磅发布：全球首款通用AI代理技术深度解析与实战指南

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

导航

统计

随笔 - 322
文章 - 1
评论 - 9
阅读 - 14万

公告

昵称： pandaboy1123
园龄： 7年
粉丝： 66
关注： 3

随笔档案

相册

Accept(2)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:【情景题】NPDP经典题目（下）
哪里有买，我想买一本NPDP..谢谢啦可以加你微信嘛，我的是18603079395
--Monkey_2014
2. Re:2019年年终总结
2020年年底总结预告：今年的目的是巩固基础，稳中求升，基本实现，身体状态稍微反弹了6斤，体重维持在146斤一年，基本稳定，后续还是加强锻炼，今年业余时间看了很多电视剧和书，情感层面得到提升，技术层面...
--pandaboy1123
3. Re:从国企到初创公司到离职，我经历了什么
@ 小白686好的，加油，选择自己喜欢的工作，做自己喜欢的事情吧...
--pandaboy1123
4. Re:从国企到初创公司到离职，我经历了什么
看了你的博客,让我感触很深,我也是学机械的,目前大四,很反感机械从事的工作.和极少的工资.感谢你给我动力,我现在正在开始学习python 目前已经有一个多月了
--小白686
5. Re:路飞学城Python-Day59(第五模块思维导图)
看了你的博客,我很欣赏你,能把你的思维导图的链接发给我吗
--小白686