2022 年 10月 27 日随笔档案 - slowlydance2me

2022年10月27日

摘要：代码如下：# 1. 定位到电影天堂最新电影更新栏目 # 2. 从其中提取到子页面的连接地址 # 3. 请求子页面的连接地址并拿到下载地址 import requests import re domain = "https://dy.dytt8.net/index2.htm" resp = reque 阅读全文

posted @ 2022-10-27 23:02 slowlydance2me 阅读(894) 评论(0) 推荐(0) 编辑

python 爬虫-----爬取豆瓣Top250 排行榜电影

摘要： step1. 打开网页并且产看源代码使用shift+F 搜索原网页中的想查找的内容发现源代码中存在相关信息说明该网页是服务器加载的数据所以我们的任务就是提取源代码并且利用re正则表达式提取数据 step2. 输入代码，请求获取网页源代码，发现无响应，说明网页采用反扒措施，需要更改用户代理U 阅读全文

posted @ 2022-10-27 21:31 slowlydance2me 阅读(140) 评论(0) 推荐(0) 编辑

python 爬虫----- 数据解析 RE解析（正则表达式）

摘要： Regular Rxpression 正则表达式（字符串语法匹配）常用元字符：量词：贪婪匹配（到最后一个匹配项停止，即全部匹配）和惰性匹配（匹配尽量少的对象，使用到回溯算法：先全部匹配再找到最小的匹配） RE 正则表达式： Python正则表达式前的 r 表示原生字符串（rawstring），阅读全文

posted @ 2022-10-27 20:20 slowlydance2me 阅读(75) 评论(0) 推荐(0) 编辑

python Tips -----encoding

摘要：阅读全文

posted @ 2022-10-27 19:27 slowlydance2me 阅读(21) 评论(0) 推荐(0) 编辑

python crawler 入门学习 -----初爬豆瓣

摘要： #进入豆瓣电影网站，点击排行榜、选择喜剧分类按下F12进入检查界面，点击Network（网络）、重新加载网站、点击typerank文件、选择XHR （XMLHttpRequest（简称xhr），是浏览器提供的JS对象，通过它可以请求到服务器上的数据资源。）在preview中找到齐全的top文件、阅读全文

posted @ 2022-10-27 19:14 slowlydance2me 阅读(52) 评论(0) 推荐(0) 编辑

初级算法 : 反转链表 ----- 递归法

摘要：给你单链表的头节点 head ，请你反转链表，并返回反转后的链表。示例 1：输入：head = [1,2,3,4,5]输出：[5,4,3,2,1]示例 2：输入：head = [1,2]输出：[2,1]示例 3：输入：head = []输出：[] 提示：链表中节点的数目范围是 [0, 50 阅读全文

posted @ 2022-10-27 17:23 slowlydance2me 阅读(12) 评论(0) 推荐(0) 编辑

slowlydance2me

公告