在网上看到爬百度贴吧的例子,仿照写了一个用BeautifulSoup实现的,直接上代码吧 Read More
posted @ 2016-08-19 18:02 zoro_robin Views(604) Comments(0) Diggs(0) Edit
1.爬虫 网络爬虫是捜索引擎抓取系统的重要组成部分。爬虫的主要目的是将互联网上的网页下载到本地形成一个或联网内容的镜像备份。通过分析和过滤HTML 代码,实现对图片、文字等资源的获取。 2.python类库之BeautifulSoup 利用python写爬虫,可以使用urllib2等库结合正则表达式 Read More
posted @ 2016-08-19 17:57 zoro_robin Views(1093) Comments(0) Diggs(0) Edit