摘要: Web页面解析 / Web page parsing 1 HTMLParser解析 下面介绍一种基本的Web页面HTML解析的方式,主要是利用Python自带的html.parser模块进行解析。其主要步骤为: 完整代码 代码中首先对模块进行导入,派生一个新的 Parser 类,随后重载方法,当遇到 阅读全文
posted @ 2018-01-08 21:38 StackLike 阅读(298) 评论(0) 推荐(0) 编辑
摘要: 统一资源定位符 / URL 目录 1 URL构成 统一资源定位符(Uniform Resource Locator) 是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。现 阅读全文
posted @ 2018-01-08 21:14 StackLike 阅读(464) 评论(0) 推荐(0) 编辑
摘要: 正则表达式 / Regular Expression 目录 正则表达式RE(Regular Expression, Regexp, Regex),又称为正规表示法,正规表达式,规则表达式,常规表达式,常规表示法,常简写为regex,regexp或RE。计算机科学的一个概念。正则表达式使用单个字符串来 阅读全文
posted @ 2018-01-08 20:37 StackLike 阅读(1441) 评论(0) 推荐(0) 编辑