草卆鱼 - 博客园

[置顶] 数据分析学习汇总

摘要： python部分第一篇实用软件安装第二篇变量常量与简单数据类型第三篇基本数据类型与用户交互第四篇各式运算符和流程控制第五篇数据类型内置方法一到五内容回顾第六篇文件操作以及作业讲解第七篇文件操作补充及函数概念第八篇函数具体讲解和使用第九篇名称空间以及代码精简第十篇模块从入门到使用阅读全文

posted @ 2021-11-24 20:35 草卆鱼阅读(129) 评论(0) 推荐(0)

2021年10月11日

王者皮肤大图

摘要：王者英雄皮肤壁纸 1.首先进入英雄资料页面https://pvp.qq.com/web201605/herolist.shtml 2.数据是直接加载的所以找到每个英雄头像对应的li标签 3.找到里面的链接herodetail/538.shtml 通过字符串拼接就能让代码进入详情页 import r 阅读全文

posted @ 2021-10-11 20:55 草卆鱼阅读(289) 评论(0) 推荐(0)

2021年10月8日

10/8

摘要：复习巩固 1.列举你所接触到的网站采取的防爬措施及解决方案(通用与自定义) 浏览器请求增加请求头中浏览器信息 ip代理池多找几个ip随机取用 cookie代理池多注册几个cookie随机取用图片防盗链在请求头中加入referer伪装成所允许的网站发出请求动态加载向实现动态加载的网站发送阅读全文

posted @ 2021-10-08 21:35 草卆鱼阅读(79) 评论(0) 推荐(0)

2021年10月4日

宇宙超级无敌烂货新整之网络爬爬爬

摘要：网络爬虫专题小课堂第一篇爬虫理论基础第二篇html各类标签以及正则第三篇网络请求和requests模块第四篇cookie和requests补充第五篇数据加载方式和网页爬取思路第六篇解析库bs4和红牛公司案例一到六内容回顾第七篇优美图库和犁视频第七篇补充梨视频胎教级思路讲解第八篇o 阅读全文

posted @ 2021-10-04 21:23 草卆鱼阅读(61) 评论(0) 推荐(0)

2021年9月28日

9/28

摘要：今日考题 1.详述豆瓣top250爬取思路(尽可能详细一些) # 以由外到内的思维方法为例 1.观察所需网页加载方式为直接加载的 2.先找到每个电影是通过li布局再页面上的先获取到整个li列表 3.再通过xpath选择器选取到所需标签 4.只有遇到没有短评的部分会比较麻烦可以找到其位置之后用xp 阅读全文

posted @ 2021-09-28 20:51 草卆鱼阅读(93) 评论(0) 推荐(0)

2021年9月23日

爬犁视频胎教级别思路讲解附完整代码

摘要：爬犁视频前期思考 1.首先还是先分析所需的网站看到我们需要点进的链接如何加载 2.发现这个部分是直接写在网站上的那就简单了，可以通过你喜欢的方法找到所需标签 3.然后再分析a标签规律尝试取到其中的链接 4.进一步检查他的转跳窗口地址并没有给全那就手动加上前面部分针对上述部分先书写出代码 impo 阅读全文

posted @ 2021-09-23 20:09 草卆鱼阅读(102) 评论(0) 推荐(0)