2019 年 10月 18 日随笔档案 - 赵钱富贵

2019年10月18日

摘要：第一部分-创建爬虫 1.urllib 1)urllib.request request.urlopen(url) request.urlretrieve 可以根据文件的 URL 下载文件 2)urllib.parse 3)urllib.error 2.异常： try...except...else. 阅读全文

posted @ 2019-10-18 10:56 赵钱富贵阅读(270) 评论(0) 推荐(0) 编辑

正则表达式（Regular Expression）

摘要： 1. \ 转义字符 ^ 匹配字符串开始 $ 匹配字符串结尾？匹配前字符0-1次 . 匹配前字符1次 + 匹配前字符1-n次 * 匹配前字符0-n次 2. \b 匹配单词边界 'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er' \B 匹配非单词边界 \d 阅读全文

posted @ 2019-10-18 09:54 赵钱富贵阅读(167) 评论(0) 推荐(0) 编辑

赵钱富贵

公告