03 2023 档案
摘要:scrapy scrapy介绍 # requsets bs4 selenium 模块 # 框架 :django ,scrapy >专门做爬虫的框架,爬虫界的django,大而全,爬虫有的东西,它都自带 安装 # 安装 (win看人品,linux,mac一点问题没有) -pip3.8 install
阅读全文
摘要:selenium基本使用 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题。selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器。 步骤 1
阅读全文
摘要:bs4模块 beautifulsoup4从HTML或XML文件中提取数据的Python库,用它来解析爬取回来的xml。 1.安装 pip install beautifulsoup4 # 下载bs4模块 pip install lxml #解析库 2. 用法 soup=BeautifulSoup('
阅读全文
摘要:面试题 -可变类型不可变类型 - 你常用的魔法方法 》某种情况会自动触发 -__init__ 类() >对象进行初始化 -__new__ 类() >产生对象 》触发__init__完成对象初始化 -__call__ person=Person() >对象加括号 person() 》触发 -__get
阅读全文
摘要:爬虫介绍 爬虫就是程序从互联网中各个网站上爬取数据,做数据清洗再入库。 爬虫的本质:模拟方式http请求,获取数据再入库。 百度其实是一个大爬虫,百度爬虫一刻不停的在互联网中爬取各个页面,爬完保存到数据库中。在百度搜索框中搜索,百度首先在数据库查询关键字获取数据,返回回来 点击某个页面 》跳转到真正
阅读全文
摘要:路飞上线流程 上线架构图 服务器:公网ip地址 云服务器:阿里云、腾讯会 阿里云购买 # 购买阿里云服务器 -阿里云官网,点选购买 注册-->云服务器ECS-->点击购买 # ssh客户端 1.xshell:只能在windows运行 2.finalshell:多平台支持Windows,macOS,L
阅读全文
摘要:路飞之搜索导航、支付宝支付 补充 # 课程详情接口带所有章节和所有章节课时 1.CourseSerializer+加个章节字段 2.不用这个序列化类CourseSerializer,需要重写章节序列化类 需要重写get_serializer_class,通过 action判断,如果是retrieve
阅读全文
摘要:路飞项目之课程表 课程前端页面 课程前端页面分别设置免费课、实战课、轻课。分析可得设置3个页面组件(FreeCourserView、ActualCourserView、LightCourseView),配置好路由 # 配置路由 { path: '/free-course', name: 'free'
阅读全文
摘要:Celery celery介绍和安装 celery是框架,是python的框架,但跟django无关的。 作用 异步任务 定时任务 延迟任务 原理 可以不依赖任何服务器,通过自身命令,启动服务 celery服务为为其他项目服务提供异步解决任务需求的 注:会有两个服务同时运行,一个是项目服务,一个是c
阅读全文
摘要:Redis Redis介绍与安装 为什么用redis缓存速度快? ```python 1 纯内存操作 2 高性能的网络模型 IO多路复用(epoll) 3 单线程,不存在线程间切换 ``` 简介 redis是缓存数据库【大部分时间做缓存,不仅仅可以做缓存】,属于非关系型数据库【区别于mysql关系型
阅读全文
摘要:路飞之登录注册接口 登录接口 接口分析可知,登录注册接口需要五个接口,分别是校验手机号是否存在的接口、多方式登录接口(用户名/手机号/邮箱+密码),发送手机验证码接口(借助于第三方短信平台)、短信登录接口、注册接口 总路由分发user路由 # 总路由 path('api/v1/user/',incl
阅读全文
摘要:git 的使用 git简介 1. 版本控制器 """ 完成 协同开发 项目,帮助程序员整合代码 1.帮助开发者合并开发的代码 2.如果出现冲突代码的合并,会提示后提交合并代码的开发者,让其解决冲突 3.代码版本管理 软件:SVN 、 GIT(都是同一个人的个人项目) github、gitee(两个采
阅读全文