摘要: re是Python的一个第三方库。 为了能更直观的看出re的效果,我们先新建一个HTML网页文件(可直接复制): index.html OK,然后我们进入主题。 re主要有三个功能:提取、匹配、替换。 1、提取findall: 注意:返回的类型是列表 我们应如何取出上文index.html中的Ema 阅读全文
posted @ 2019-12-19 23:39 WoLykos 阅读(4987) 评论(0) 推荐(0) 编辑
摘要: 说到爬虫,不可避免的会牵涉到正则表达式。 因为你需要清晰地知道你需要爬取什么信息?它们有什么共同点?可以怎么去表示它们? 而这些,都需要我们熟悉正则表达,才能更好地去提取。 先简单复习一下各表达式所代表的意思: 案例: 定义密码的正则表达式: 表达式为: 或 匹配div标签,class="class 阅读全文
posted @ 2019-12-19 22:47 WoLykos 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 一、HTML HTML是Hyper Text Markup Language(超文本标记语言)的缩写。 HTML不是一种编程语言,而是标记语言。 HTML的语法 双标签: 单标签: HTML的元素和属性 元素 HTML的结构 ``————文件为html文件 ``————语言类型:英语 ``————头 阅读全文
posted @ 2019-12-19 20:23 WoLykos 阅读(997) 评论(0) 推荐(0) 编辑
摘要: 相信用Python写def函数大家都信手拈来了,但Python作为面向对象的编程语言,怎么能浪费呢? 那问题来了。什么是类呢?什么是实例?什么是对象?方法是什么??属性又是什么???继承?封装?多态? 对于这些的疑问,在这里统统都不会讲到啊哈哈哈哈,~~毕竟你完全可以轻易 Google 到,~~ 如 阅读全文
posted @ 2019-12-19 14:05 WoLykos 阅读(263) 评论(0) 推荐(0) 编辑