摘要: 一. BeautifulSoup的官方解释: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。 Beautiful Soup自动将输入 阅读全文
posted @ 2017-06-30 17:40 绵绵01 阅读(674) 评论(0) 推荐(0) 编辑
摘要: 一。思路:python 内置了两个网络库 urlib和urlib2,但是这两个库使用起来不是很方便,所以这里使用广受好评的第三库requests。 (基本思路使用requests获取页面信息,使用正则表达式解析页面,为了更加迅速的爬取数据,使用multiprocessing实现多进程抓取。下一篇文章 阅读全文
posted @ 2017-06-30 17:09 绵绵01 阅读(6112) 评论(0) 推荐(0) 编辑
levels of contents