上一页 1 ··· 4 5 6 7 8
摘要: 1.什么是爬虫 爬虫,即网络爬虫,大家可以理解为在网络上爬行的一直蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛咯,如果它遇到资源,那么它就会抓取下来。想抓取什么?这个由你来控制它咯。 比如它在抓取一个网页,在这个网中他发现了一条道路,其实就是指向网页的超链接,那么它就可以爬到另一张 阅读全文
posted @ 2017-02-27 13:44 pxuan 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 那么接下来,小伙伴们就一起和我真正迈向我们的爬虫之路吧。 1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他 阅读全文
posted @ 2017-02-27 13:44 pxuan 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 大家好哈,最近博主在学习Python,学习期间也遇到一些问题,获得了一些经验,在此将自己的学习系统地整理下来,如果大家有兴趣学习爬虫的话,可以将这些文章作为参考,也欢迎大家一共分享学习经验。 Python版本:2.7,Python 3请另寻其他博文。 首先爬虫是什么? 网络爬虫(又被称为网页蜘蛛,网 阅读全文
posted @ 2017-02-27 13:43 pxuan 阅读(343) 评论(0) 推荐(0) 编辑
摘要: 大家好哈,最近博主在学习Python,学习期间也遇到一些问题,获得了一些经验,在此将自己的学习系统地整理下来,如果大家有兴趣学习爬虫的话,可以将这些文章作为参考,也欢迎大家一共分享学习经验。 Python版本:2.7,Python 3请另寻其他博文。 首先爬虫是什么? 网络爬虫(又被称为网页蜘蛛,网 阅读全文
posted @ 2017-02-27 13:42 pxuan 阅读(928) 评论(0) 推荐(0) 编辑
摘要: 原来ThinkPHP自带了生成静态页的函数buildHtml,使用起来很方便!最新的手册里没写这个方法,向大家介绍一下。 PHP 1 2 3 4 5 6 7 8 9 10 11 protected function buildHtml($htmlfile='',$htmlpath='',$templ 阅读全文
posted @ 2017-02-23 17:47 pxuan 阅读(4186) 评论(0) 推荐(0) 编辑
摘要: 1. 安装svn命令行工具 Subversion for Windows下载https://sourceforge.net/projects/win32svn/?source=typ_redirect 2. 配置 pycharm File ->Settings -> Version Control 阅读全文
posted @ 2017-02-23 17:12 pxuan 阅读(4550) 评论(0) 推荐(0) 编辑
摘要: 了解python的人都知道python有2.x版本和3.x版本,而python3.x版本不向下兼容,但是根据具体的需要,有时候要2.x和3.x共存,python共存本身没有问题,只是需要设置一些环境变量和修改一些东西来让它更容易使用。本文主要说明的是windows环境, 1. 首先当然是安装你需要的 阅读全文
posted @ 2017-02-17 10:50 pxuan 阅读(12511) 评论(0) 推荐(2) 编辑
摘要: 1、数字int(整型)在32位机器上,整数的位数为32位,取值范围为-2**31~2**31-1,即-2147483648~2147483647在64位系统上,整数的位数为64位,取值范围为-2**63~2**63-1,即-9223372036854775808~922337203685477580 阅读全文
posted @ 2017-02-15 17:16 pxuan 阅读(178) 评论(0) 推荐(0) 编辑
摘要: HTML5概述HTML5於2004年被WHATWG(网页超文本技术工作小组)提出,於2007年被W3C接纳。在2008年1月22日,第一份正式草案已公布。WHATWG表示该规范是目前正在进行的工作,仍须多年的努力。 HTML 版本从 Web 诞生早期至今,已经发展出多个 HTML 版本:1、HTML 阅读全文
posted @ 2017-02-14 11:20 pxuan 阅读(285) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8