摘要: Urllib基础 urllib.request.urlretrieve(url,filenname) 直接将网页下载到本地 清理下载网页时的缓存 urllib.request.urlcleanup() info getcode() 返回状态吗 202 成功 403 禁止访问 geturl() 查询当 阅读全文
posted @ 2017-09-18 20:34 行走的丸子 阅读(258) 评论(0) 推荐(0) 编辑
摘要: 读取csdn网页,现在我们要把网页中讲课老师名字提取出来 阅读全文
posted @ 2017-09-18 19:30 行走的丸子 阅读(193) 评论(0) 推荐(0) 编辑
摘要: 正则表达式 只提取关注的数据,进行数据赛选 原子: 基本组成单位 普通的字符 非打印支付 通用字符 普通的字符 非打印字符() 通用字符 |w |W处理字符下滑线任意的字符 |d 十进位数 |D |s 空白字符 |S 原子表 【jsz】表示 只有一位的匹配出来 元字符 特殊含义的字符,比如重复前边的 阅读全文
posted @ 2017-09-18 16:13 行走的丸子 阅读(353) 评论(0) 推荐(0) 编辑