08 2016 档案

摘要:上节简单演示了如何获取一个网页的源代码,本节继续,稍微提升一下我们的水平,网页的源代码中通常包含了大量无用的东西,如果你了解html相关知识的话,就会知道网页源代码中还有大量的标签、css代码、js代码,而这些对我们来说,一般都是不需要的,因此,当我们把网页源代码拿到手之后,还需要对它进行一定的处理 阅读全文
posted @ 2016-08-15 15:59 Mr..D 阅读(2427) 评论(0) 推荐(0) 编辑
摘要:网络爬虫简介 所谓爬虫,其实就是自动从互联网上获取网页信息的程序或者脚本,甚至简单到一两行代码,只要能达到自动获取信息的目的,都可以称之为爬虫。 本系列文章主要是为那些希望加入爬虫界的小白们准备的,水平有限,大牛请包涵。爬虫程序分类简介 程序可大致分为两种,可视化和非可视化的爬虫程序。 可视化爬虫工 阅读全文
posted @ 2016-08-12 18:11 Mr..D 阅读(440) 评论(1) 推荐(0) 编辑

点击右上角即可分享
微信分享提示