python爬虫 - 随笔分类 - 进击的许盈盈

python爬虫 xpath

摘要：导入模块, 代码: from lxml import etree 将HTML文件解析成 Xpath对象代码: html = etree.HTML(text) 调用Xpath解析对象的xpath 方法, 对内容进行解析常用运算符 | 计算两个节点集 //book | //cd 返回所有拥有 boo 阅读全文

posted @ 2022-01-14 05:00 进击的许盈盈阅读(41) 评论(0) 推荐(0) 编辑

关于chrome dev tools一些技巧

摘要：Chrome开发者工具（简称DevTools）是一组网页制作和调试的工具，内嵌于Google Chrome浏览器中。DevTools使开发者更加深入的了解浏览器内部以及他们编写的应用。通过使用DevTools，可以更加高效的定位页面布局问题，设置JavaScript断点并且更好的理解代码优化 htt 阅读全文

posted @ 2022-01-10 06:55 进击的许盈盈阅读(263) 评论(0) 推荐(0) 编辑

一次批量复制多个不同结果到剪贴板---不用在粘贴文本与被粘贴文本之间反复横跳啦,

摘要：自学看杨锐老师的爬虫教学视频时,发现老师隔行批量复制了多个语句到多个剪贴板上,后发现windows也有这个功能, 以下是win11的演示 ↓ ↓ ↓ ↓ ↓ ↓ 阅读全文

posted @ 2022-01-09 11:11 进击的许盈盈阅读(250) 评论(0) 推荐(0) 编辑

发现豆瓣登录密码没有被加密

摘要：重新创建一个新密码演示xyydemima 结果如图,密码没被加密会容易被拦截破译 20220118 领英的密码也没有加密阅读全文

posted @ 2022-01-09 09:00 进击的许盈盈阅读(45) 评论(0) 推荐(0) 编辑

响应状态码

摘要：服务端返回给客户端,分为三部分: 响应状态码(Response Status Code) 响应头(Respongse Headers) 响应体(Respongse Body) 爬虫爬次数多了会被封ip,显示403 阅读全文

posted @ 2022-01-08 13:20 进击的许盈盈阅读(191) 评论(0) 推荐(0) 编辑

Requests库学习

摘要：Requests is an elegant and simple HTTPlibrary for Python, built for human beings. 此处是讽刺python自带的库Requests 出自官网: Requests: HTTP for Humans™ — Requests 阅读全文

posted @ 2022-01-08 06:48 进击的许盈盈阅读(53) 评论(0) 推荐(0) 编辑

Html框架及格式

摘要：有一个通常的比喻:HTML相当于人的骨骼,决定了网页的大体框架结构;CSS相当于人的皮肤,决定了网页看起来的风格样式;JavaScript相当于人的肌肉,使网页能够响应你的操作,做出各种活动 HTML，是网页的基础架构,它用各种标签来表示内容<head></head>内部的代码表示头部信息 <bod 阅读全文

posted @ 2022-01-07 07:12 进击的许盈盈阅读(475) 评论(0) 推荐(0) 编辑

随笔分类 - python爬虫

随笔分类