摘要:
re库的贪婪匹配和最小匹配 后面跟着?变为最小匹配 阅读全文
摘要:
正则表达式是用来简洁表达一组字符串的表达式 正则表达式可以用来判断某字符串的特征归属 阅读全文
摘要:
标记后的信息可形成信息组织结构,增肌了信息维度,可用于通信,存储或展示,利于程序的理解和运用 XML是被设计用来描述数据的,重点是:什么是数据,如何存放数据。 HTML是被设计用来显示数据的,重点是:显示数据以及如何显示数据更好上面。 信息标记的三种形式:xml, json,yaml yaml说明 阅读全文
摘要:
bs4库的HTML内容遍历方法 基于bs4库的HTML格式输出 显示:友好的显示 <tag>.prettify() 编码:bs4库将任何HTML输入都变成utf-8编码(python 3.x) bs4库的查找方法 阅读全文