摘要: 一.re 这个去匹配比较麻烦,以后也比较少用,简单看一个案例就行 二.使用re的注意点 1.Windows转义符 2.避免出错 在正则表达式中尽量使用原始字符串,在待匹配字符中看到什么就在正则表达式中写什么,不容易出问题 原始字符串的查看,可以借助ipython去查看,不要使用print 3. 阅读全文
posted @ 2019-02-26 21:09 阿布_alone 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 一.什么是爬虫 爬虫的概念: 通过编写程序,模拟浏览器上网,让其去互联网上爬取数据的过程. 爬虫的工作流程: 模拟浏览器发送请求->下载网页代码->只提取有用的数据->存放于数据库或文件中 爬虫的分类: 通用爬虫:爬取全部的页面数据. 聚焦爬虫: 抓取页面中局部的页面数据 增量式爬虫:爬取网站中更新 阅读全文
posted @ 2019-02-26 15:39 阿布_alone 阅读(3055) 评论(0) 推荐(1) 编辑
TOP