python爬虫 xpath
摘要:导入模块, 代码: from lxml import etree 将HTML文件解析成 Xpath对象 代码: html = etree.HTML(text) 调用Xpath解析对象的xpath 方法, 对内容进行解析 常用运算符 | 计算两个节点集 //book | //cd 返回所有拥有 boo
阅读全文
posted @
2022-01-14 05:00
进击的许盈盈
阅读(41)
推荐(0) 编辑
关于chrome dev tools一些技巧
摘要:Chrome开发者工具(简称DevTools)是一组网页制作和调试的工具,内嵌于Google Chrome浏览器中。DevTools使开发者更加深入的了解浏览器内部以及他们编写的应用。通过使用DevTools,可以更加高效的定位页面布局问题,设置JavaScript断点并且更好的理解代码优化 htt
阅读全文
posted @
2022-01-10 06:55
进击的许盈盈
阅读(256)
推荐(0) 编辑
一次批量复制多个不同结果到剪贴板---不用在粘贴文本与被粘贴文本之间反复横跳啦,
摘要:自学看杨锐老师的爬虫教学视频时,发现老师隔行批量复制了多个语句到多个剪贴板上,后发现windows也有这个功能, 以下是win11的演示 ↓ ↓ ↓ ↓ ↓ ↓
阅读全文
posted @
2022-01-09 11:11
进击的许盈盈
阅读(249)
推荐(0) 编辑
发现豆瓣登录密码没有被加密
摘要:重新创建一个新密码演示xyydemima 结果如图,密码没被加密会容易被拦截破译 20220118 领英的密码也没有加密
阅读全文
posted @
2022-01-09 09:00
进击的许盈盈
阅读(45)
推荐(0) 编辑
响应状态码
摘要:服务端返回给客户端,分为三部分: 响应状态码(Response Status Code) 响应头(Respongse Headers) 响应体(Respongse Body) 爬虫爬次数多了会被封ip,显示403
阅读全文
posted @
2022-01-08 13:20
进击的许盈盈
阅读(191)
推荐(0) 编辑
Requests库学习
摘要:Requests is an elegant and simple HTTPlibrary for Python, built for human beings. 此处是讽刺python自带的库Requests 出自官网: Requests: HTTP for Humans™ — Requests
阅读全文
posted @
2022-01-08 06:48
进击的许盈盈
阅读(53)
推荐(0) 编辑
Html框架及格式
摘要:有一个通常的比喻:HTML相当于人的骨骼,决定了网页的大体框架结构;CSS相当于人的皮肤,决定了网页看起来的风格样式;JavaScript相当于人的肌肉,使网页能够响应你的操作,做出各种活动 HTML,是网页的基础架构,它用各种标签来表示内容<head></head>内部的代码表示头部信息 <bod
阅读全文
posted @
2022-01-07 07:12
进击的许盈盈
阅读(471)
推荐(0) 编辑