上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 19 下一页
摘要: PyQuery模块也是一个解析html的一个模块,它和Beautiful Soup用起来差不多,它是jquery实现的,和jquery语法差不多,会用jquery的人用起来就比较方便了。 Pyquery需要依赖lxml模块,不装的话,使用会报错。 安装 pip install lxml pip in 阅读全文
posted @ 2020-04-20 22:01 飞鸟与新月 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 说明《透视HTTP协议》是 罗剑锋 (奇虎360技术专家)在极客时间开的一门专栏课,笔者记录一下学习笔记,仅供参考。 上一讲中我们学习了对称加密和非对称加密,以及两者结合起来的混合加密,实现了机密性。 但仅有机密性,离安全还差的很远。 黑客虽然拿不到会话密钥,无法破解密文,但可以通过窃听收集到足够多 阅读全文
posted @ 2020-04-20 21:20 飞鸟与新月 阅读(412) 评论(0) 推荐(0) 编辑
摘要: 这篇介绍Beautiful Soup怎么用,这个模块是用来解析html的,它操作很简单,用起来比较方便 这是第三方模块需要安装 pip install beautifulsoup4 pip install lxml Beautiful Soup对象 Beautiful将复杂HTML文档转换成一个复杂 阅读全文
posted @ 2020-04-19 16:56 飞鸟与新月 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 说明《透视HTTP协议》是 罗剑锋 (奇虎360技术专家)在极客时间开的一门专栏课,笔者记录一下学习笔记,仅供参考。 在上一讲中,我们初步学习了 HTTPS,知道 HTTPS 的安全性是由 TLS 来保证的。 你一定很好奇,它是怎么为 HTTP 增加了机密性、完整性,身份认证和不可否认等特性的呢? 阅读全文
posted @ 2020-04-18 13:22 飞鸟与新月 阅读(705) 评论(0) 推荐(0) 编辑
摘要: 写了怎么发请求和获取到数据,接下来就是该怎么处理数据了,打开一个网站之后,它会返回很多数据,数据很多,有很多都是咱们不需要的,咱们写爬虫的话只获取到对咱们自己有用的数据,就要从返回的数据里面找到咱们需要的数据,然后保存起来。那怎么筛选到咱们需要的数据呢,就得用正则表达式了,正则表达就是写各种规则来匹 阅读全文
posted @ 2020-04-18 13:21 飞鸟与新月 阅读(237) 评论(0) 推荐(0) 编辑
摘要: 爬虫的原理就是写代码自动化的获取数据,保存下来数据,那怎么写代码来请求一个网址,获取结果呢?就用到requests模块了。 requests模块是python的一个第三方模块,它是基于python自带的urllib模块封装的,用来发送http请求和获取返回的结果。 requests模块是第三方模块, 阅读全文
posted @ 2020-04-16 22:55 飞鸟与新月 阅读(284) 评论(0) 推荐(0) 编辑
摘要: 说明《透视HTTP协议》是 罗剑锋 (奇虎360技术专家)在极客时间开的一门专栏课,笔者记录一下学习笔记,仅供参考。 从今天开始,我们开始进入全新的“安全篇”,聊聊与安全相关的 HTTPS、SSL、TLS。 在第 14 讲中,我曾经谈到过 HTTP 的一些缺点,其中的“无状态”在加入 Cookie 阅读全文
posted @ 2020-04-16 22:11 飞鸟与新月 阅读(845) 评论(0) 推荐(0) 编辑
摘要: 爬虫就是发送http请求(浏览器里面打开发送的都是http请求),然后获取到response,咱们再从response里面找到想要的数据,存储到本地。 接下来就说一下什么是http请求,它里面都有哪些东西,我们在写爬虫的时候,怎么http请求,里面哪些对我们的爬虫有影响。 http请求过程 咱们打开 阅读全文
posted @ 2020-04-15 22:19 飞鸟与新月 阅读(299) 评论(0) 推荐(0) 编辑
摘要: 说明《透视HTTP协议》是 罗剑锋 (奇虎360技术专家)在极客时间开的一门专栏课,笔者记录一下学习笔记,仅供参考。 在第 20 讲中,我介绍了 HTTP 的缓存控制,第 21 讲我介绍了 HTTP 的代理服务。那么,把这两者结合起来就是这节课所要说的“缓存代理”,也就是支持缓存控制的代理服务。 之 阅读全文
posted @ 2020-04-15 21:56 飞鸟与新月 阅读(360) 评论(0) 推荐(0) 编辑
摘要: 练习题:制作表格 循环提示用户输入:用户名、密码、邮箱(要求用户输入的长度不能超过20个字符,如果超过则只有前20个字符有效),如果用户输入q或者Q表示不再继续输入,将用户的内容一表格形式打印 s = "" while True: v1 = input('请输入你的名字') v2 = input(' 阅读全文
posted @ 2020-04-14 23:17 飞鸟与新月 阅读(1179) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 19 下一页