摘要: re库的贪婪匹配和最小匹配 后面跟着?变为最小匹配 阅读全文
posted @ 2017-06-11 22:48 x.cube 阅读(621) 评论(0) 推荐(0) 编辑
摘要: 正则表达式是用来简洁表达一组字符串的表达式 正则表达式可以用来判断某字符串的特征归属 阅读全文
posted @ 2017-06-11 22:14 x.cube 阅读(320) 评论(0) 推荐(0) 编辑
摘要: 标记后的信息可形成信息组织结构,增肌了信息维度,可用于通信,存储或展示,利于程序的理解和运用 XML是被设计用来描述数据的,重点是:什么是数据,如何存放数据。 HTML是被设计用来显示数据的,重点是:显示数据以及如何显示数据更好上面。 信息标记的三种形式:xml, json,yaml yaml说明 阅读全文
posted @ 2017-06-11 15:26 x.cube 阅读(458) 评论(0) 推荐(0) 编辑
摘要: bs4库的HTML内容遍历方法 基于bs4库的HTML格式输出 显示:友好的显示 <tag>.prettify() 编码:bs4库将任何HTML输入都变成utf-8编码(python 3.x) bs4库的查找方法 阅读全文
posted @ 2017-06-11 13:22 x.cube 阅读(177) 评论(0) 推荐(0) 编辑