随笔分类 - spider
摘要:BeautifulSoup简介 BeautifulSoup简介Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: 官方文档 安装BeautifulSoup库 Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python
阅读全文
摘要:简介 正则表达式是对字符串的一种逻辑公式,用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则的字符串”,此字符串用来表示对字符串的一种“过滤”逻辑。正在在很多开发语言中都存在,而非python独有。 匹配规则 字符 注释 检索字符串 表达式 成功匹配对象 . 匹配除换行符(\n)以外的
阅读全文