香菜根 - 博客园

2022年8月3日

摘要： xpath的使用简介：XPath 是一门在 XML 文档中查找信息的语言 # 一般解析库都会有子的的搜索标签的方法，一般都会支持css和xpath # XPath 是一门在 XML 文档中查找信息的语言 # 需要你记住的： -div 找div标签 -/ 找当前路径下的标签 - /div/a -// 阅读全文

posted @ 2022-08-03 19:08 香菜根阅读(45) 评论(0) 推荐(0) 编辑

几个爬虫实例

摘要：爬红楼梦小说 #http://www.shicimingju.com/book/hongloumeng.html import requests from bs4 import BeautifulSoup ret=requests.get('https://www.shicimingju.com/b 阅读全文

posted @ 2022-08-03 18:59 香菜根阅读(65) 评论(0) 推荐(0) 编辑

selenium基本使用、无界面浏览器、selenium其它用法、selenium登录cnblogs获取cookie、动作链

摘要： selenium基本使用 # 由于requests不能执行js，有的页面内容，我们在浏览器中可以看到，但是请求下来没有》selenium模块：模拟操作浏览器，完成人的行为 # selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码阅读全文

posted @ 2022-08-03 18:56 香菜根阅读(261) 评论(0) 推荐(0) 编辑

BeautifulSoup4介绍及使用、爬取新闻

摘要： BeautifulSoup4 介绍 # Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库 # 使用requests发请求拿回来的html，就可以使用bs4解析出咱们想要的数据 # BeautifulSoup(要解析的字符串, "解析方式：html.parser 阅读全文

posted @ 2022-08-03 18:22 香菜根阅读(154) 评论(0) 推荐(0) 编辑

代理池搭建、django后端获取客户端的ip、爬某视频

摘要：代理池搭建 # 在爬一些网站的时候可能会被封ip，根据ip限制频率》突破限制》每次发送请求使用代理ip 》服务端封ip，只会限制代理ip # 做一个代理池》有很多代理ip 》每次随机从里面取出一个ip使用 # 免费的:不稳定 # 收费的：花钱 # 基于网上别人开源的代理池的python代码，自阅读全文

posted @ 2022-08-03 18:14 香菜根阅读(80) 评论(0) 推荐(0) 编辑

requests介绍及使用

摘要： requests 介绍 #介绍：使用requests可以模拟浏览器的请求，比起之前用到的urllib，requests模块的api更加便捷（本质就是封装了urllib3） #注意：requests库发送请求将网页内容下载下来以后，并不会执行js代码，这需要我们自己分析目标站点然后发起新的reques 阅读全文

posted @ 2022-08-03 17:40 香菜根阅读(293) 评论(0) 推荐(0) 编辑

2022年7月17日

课程列表页前端、课程板块相关表分析及创建

摘要：课程列表页前端 # 前端配置路由 const routes = [ 。。。 { path: '/actual-course', name: 'actual-course', component: Course }, ] cours.vue <template> <div class="course" 阅读全文

posted @ 2022-07-17 17:09 香菜根阅读(94) 评论(0) 推荐(0) 编辑

celery包结构、秒杀、celery异步任务，延迟任务，定时任务、双写一致性、django中使用celery

摘要： celery包结构 # 包结构，用的多，好处，写好了包，以后copy到任意项目中，都可以顺利使用目录 celery_task # 包 __init__.py celery.py goods_task.py order_task.py user_task.py # 其它项目：提交和查询结果 add_ 阅读全文

posted @ 2022-07-17 17:05 香菜根阅读(138) 评论(0) 推荐(0) 编辑

celery介绍架构和安装和基本使用

摘要： celery介绍架构和安装 celery:芹菜，分布式异步任务框架注意： Celery is a project with minimal funding, so we don’t support Microsoft Windows. Please don’t open any issues re 阅读全文

posted @ 2022-07-17 16:27 香菜根阅读(81) 评论(0) 推荐(0) 编辑

django中集成redis

摘要： django中集成redis 方式一:通用方案写一个pool包 import redis POOL=redis.ConnectionPool(max_connections=1024,decode_responses=True) 再使用的位置导入 conn = Redis(connection_p 阅读全文

posted @ 2022-07-17 16:15 香菜根阅读(51) 评论(0) 推荐(0) 编辑

Loading

你脱发吗

公告