摘要: 代码如下:# 1. 定位到电影天堂最新电影更新栏目 # 2. 从其中提取到子页面的连接地址 # 3. 请求子页面的连接地址并拿到下载地址 import requests import re domain = "https://dy.dytt8.net/index2.htm" resp = reque 阅读全文
posted @ 2022-10-27 23:02 slowlydance2me 阅读(803) 评论(0) 推荐(0) 编辑
摘要: step1. 打开网页 并且产看源代码 使用shift+F 搜索原网页中的想查找的内容 发现源代码中存在相关信息 说明该网页是服务器加载的数据 所以我们的任务就是提取源代码并且利用re正则表达式提取数据 step2. 输入代码,请求获取网页源代码,发现无响应,说明网页采用反扒措施,需要更改用户代理U 阅读全文
posted @ 2022-10-27 21:31 slowlydance2me 阅读(138) 评论(0) 推荐(0) 编辑
摘要: Regular Rxpression 正则表达式(字符串语法匹配) 常用元字符: 量词: 贪婪匹配(到最后一个匹配项停止,即全部匹配)和惰性匹配(匹配尽量少的对象,使用到回溯算法:先全部匹配再找到最小的匹配) RE 正则表达式: Python正则表达式前的 r 表示原生字符串(rawstring), 阅读全文
posted @ 2022-10-27 20:20 slowlydance2me 阅读(72) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2022-10-27 19:27 slowlydance2me 阅读(19) 评论(0) 推荐(0) 编辑
摘要: #进入豆瓣电影网站,点击排行榜、选择喜剧分类 按下F12进入检查界面,点击Network(网络)、重新加载网站、点击typerank文件、选择XHR (XMLHttpRequest(简称xhr),是浏览器提供的JS对象,通过它可以请求到服务器上的数据资源。) 在preview中找到齐全的top文件、 阅读全文
posted @ 2022-10-27 19:14 slowlydance2me 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 示例 1: 输入:head = [1,2,3,4,5]输出:[5,4,3,2,1]示例 2: 输入:head = [1,2]输出:[2,1]示例 3: 输入:head = []输出:[] 提示: 链表中节点的数目范围是 [0, 50 阅读全文
posted @ 2022-10-27 17:23 slowlydance2me 阅读(9) 评论(0) 推荐(0) 编辑