08 2020 档案
摘要:0. 常用匹配规则 ^ 匹配字符串的开头 $ 匹配字符串的结尾 [...] 匹配一组字符,比如 [abc] 表示匹配小写字母 a 或者 b 或者 c,[a-z] 表示匹配所有的小写字母,[0-3] 表示匹配数字 0,1,2,3 [^...] 匹配不在 []中的字符 . 匹配除了换行符以外的任意字符,
阅读全文
摘要:0. 安装及导入 安装 pip install beautifulsoup4 导入 from bs4 import BeautifulSoup 如果选择 lxml 解析器的话还需要安装 pip install lxml,这个解析器的优点是效率更高 1. 访问结构化数据 假设我们有下面这段 HTML
阅读全文