08 2016 档案

跟我学爬虫-2-使用正则表达式解析文本

摘要：上节简单演示了如何获取一个网页的源代码，本节继续，稍微提升一下我们的水平，网页的源代码中通常包含了大量无用的东西，如果你了解html相关知识的话，就会知道网页源代码中还有大量的标签、css代码、js代码,而这些对我们来说，一般都是不需要的，因此，当我们把网页源代码拿到手之后，还需要对它进行一定的处理阅读全文

posted @ 2016-08-15 15:59 Mr..D 阅读(2427) 评论(0) 推荐(0) 编辑

跟我学爬虫-1-爬虫简介

摘要：网络爬虫简介所谓爬虫，其实就是自动从互联网上获取网页信息的程序或者脚本，甚至简单到一两行代码，只要能达到自动获取信息的目的，都可以称之为爬虫。本系列文章主要是为那些希望加入爬虫界的小白们准备的，水平有限，大牛请包涵。爬虫程序分类简介程序可大致分为两种，可视化和非可视化的爬虫程序。可视化爬虫工阅读全文

posted @ 2016-08-12 18:11 Mr..D 阅读(440) 评论(1) 推荐(0) 编辑

Mr.D

08 2016 档案

公告