上一页 1 ··· 6 7 8 9 10 11 12 13 14 15 下一页
摘要: selenium 一、前期准备 1、概述 selenium本身是一个自动化测试工具。它可以让python代码调用浏览器。并获取到浏览器中加载的各种资源。 我们可以利用selenium提供的各项功能。 帮助我们完成数据的抓取。 2、学习目标 掌握 selenium发送请求,加载网页的方法 掌握 sel 阅读全文
posted @ 2023-03-25 08:57 凫弥 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 抓取m3u8视频 1、思路分析 视频url:https://www.9tata.cc/play/96310-4-0.html 打开网址分析当前视频是由多个片段组成还是单独一个视频 如果是一个单独视频,则找到网址,直接下载即可,如果为多个片段的视频,则需要找到片段的文件进行处理,本案例以m3u8为例 阅读全文
posted @ 2023-03-24 19:52 凫弥 阅读(1091) 评论(0) 推荐(0) 编辑
摘要: 一、协程 概念 1.什么是协程? 协程 又称微线程(纤程),是一种用户态的轻量级线程 子程序 在所有的语言中都是层级调用的,比如A中调用B,B在执行过程中调用C,C执行完返回,B执行完返回,最后是A执行完毕。这是通过栈实现的,一个函数就是一个执行的子程序,子程序的调用总是有一个入口、一次返回,调用的 阅读全文
posted @ 2023-03-24 19:45 凫弥 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 一、线程 1、概念 线程 在一个进程的内部,要同时干多件事,就需要同时运行多个“子任务”,我们把进程内的这些“子任务”叫做线程 是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同 阅读全文
posted @ 2023-03-24 17:33 凫弥 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 高效编程 一、多任务原理 概念 现代操作系统比如Mac OS X,UNIX,Linux,Windows等,都是支持“多任务”的操作系统 什么叫多任务? 就是操作系统可以同时运行多个任务 单核CPU实现多任务原理 操作系统轮流让各个任务交替执行,QQ执行2us(微秒),切换到微信,在执行2us,再切换 阅读全文
posted @ 2023-03-24 16:26 凫弥 阅读(87) 评论(0) 推荐(0) 编辑
摘要: 前情摘要 一、web请求全过程剖析 我们浏览器在输入完网址到我们看到网页的整体内容, 这个过程中究竟发生了些什么? 我们看一下一个浏览器请求的全过程 接下来就是一个比较重要的事情了. 所有的数据都在页面源代码里么? 非也~ 这里要介绍一个新的概念 那就是页面渲染数据的过程, 我们常见的页面渲染过程有 阅读全文
posted @ 2023-03-18 10:42 凫弥 阅读(64) 评论(0) 推荐(0) 编辑
摘要: xpath 1、xpath安装与使用 安装 安装lxml库 pip install lxml -i pip源 2、解析流程与使用 from lxml import etree # 解析本地HTML文件 # parser = etree.HTMLParser(encoding="utf-8") # t 阅读全文
posted @ 2023-03-18 10:21 凫弥 阅读(92) 评论(0) 推荐(0) 编辑
摘要: beautifulsoup 一、beautifulsoup的简单使用 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。 它是一个工具箱,通 阅读全文
posted @ 2023-03-18 10:14 凫弥 阅读(53) 评论(0) 推荐(0) 编辑
摘要: 一、正则基础 1 [] 原子表 [a] 匹配小写字母a [x] 匹配小写字母x [ab] 匹配小写字母a或b [abc] 匹配小写字母a或者b或者c [0123456789] 匹配任意一位数字 [0-9] 匹配任意一位数字 [a-z] 匹配任意一位小写字母 [A-Z] 匹配任意一位大写字母 [a-z 阅读全文
posted @ 2023-03-18 10:05 凫弥 阅读(39) 评论(0) 推荐(0) 编辑
摘要: HTML(HyperText Markup Language) 前言 软件架构 B/S ​ Browser/Server 网站 C/S ​ Client/Server QQ HTML的简介、发展史: 万维网联盟(W3C)维护。包含HTML内容的文件最常用的扩展名是.html,但是像DOS这样的旧操作 阅读全文
posted @ 2023-03-17 19:37 凫弥 阅读(37) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 12 13 14 15 下一页