摘要: 第一部分-创建爬虫 1.urllib 1)urllib.request request.urlopen(url) request.urlretrieve 可以根据文件的 URL 下载文件 2)urllib.parse 3)urllib.error 2.异常: try...except...else. 阅读全文
posted @ 2019-10-18 10:56 赵钱富贵 阅读(270) 评论(0) 推荐(0) 编辑
摘要: 1. \ 转义字符 ^ 匹配字符串开始 $ 匹配字符串结尾 ? 匹配前字符0-1次 . 匹配前字符1次 + 匹配前字符1-n次 * 匹配前字符0-n次 2. \b 匹配单词边界 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er' \B 匹配非单词边界 \d 阅读全文
posted @ 2019-10-18 09:54 赵钱富贵 阅读(167) 评论(0) 推荐(0) 编辑