随笔分类 - 爬虫
摘要:正则表达式 import re 限定符(quantifier) a* a出现0次或者多次 a+ a出现1次或者多次 a? a出现0次或者一次 a{6} a出现6次 a{2,6} a出现2-6次 a{2,} a出现两次以上 或运算符(OR Operator) (a|b) 匹配 (ab)|(cd) 匹配
阅读全文
摘要:What's 爬虫? 简单来说: 爬虫,即网络蜘蛛,是伪装成客户端与服务器进行数据交互的程序。 代码 点击查看代码 from bs4 import BeautifulSoup #网页解析 import urllib.request,urllib.error #制定URL,获取网页数据 import
阅读全文