摘要: 字符串编码在Python里边是经常会遇到的问题,特别是写文件以及网络传输的过程中,当调用某些函数的时候经常会遇到一些字符串编码提示错误,所以有必要弄清楚这些编码到底在搞什么鬼。 我们都知道计算机只能处理数字,文本转换为数字才能处理。计算机中8个bit作为一个字节,所以一个字节能表示最大的数字就是25 阅读全文
posted @ 2018-12-05 20:09 dcpeng 阅读(416) 评论(0) 推荐(0) 编辑
摘要: 一般的,我们想抓取一个网站所有的URL,首先通过起始URL,之后通过网络爬虫提取出该网页中所有的URL链接,之后再对提取出来的每个URL进行爬取,提取出各个网页中的新一轮URL,以此类推。整体的感觉就是自上而下进行抓取网页中的链接,理论上来看,可以抓取整站所有的链接。但是问题来了,一个网站中网页的链 阅读全文
posted @ 2018-11-30 20:09 dcpeng 阅读(1866) 评论(0) 推荐(0) 编辑
摘要: 关于水晶易表的介绍在之前的文章就有提及过,感兴趣的小伙伴可以戳这篇文章:关于水晶易表的简介及其安装初识,在此不再进行赘述。今天给大家分享一下水晶易表的安装教程,本文以水晶易表2008版本进行示例,手把手教会你安装。 1、在正式安装水晶易表之前,我们要保证Adobe Flash Player已经安装好 阅读全文
posted @ 2018-11-23 15:04 dcpeng 阅读(499) 评论(0) 推荐(0) 编辑
摘要: 很多小伙伴在安装水晶易表的时候,经常会遇到“Xcelsius2008需要使用Adobe Flash Player(9.151或者更高版本)”报错问题,如下图所示。 导致安装进程受阻,此时就需要安装高版本的Adobe Flash Player。从网站上下载Adobe Flash Player,然后开始 阅读全文
posted @ 2018-11-18 20:31 dcpeng 阅读(1836) 评论(0) 推荐(0) 编辑
摘要: 前几天给大家分享了网络爬虫中深度优先算法的介绍及其代码实现过程,没来得及上车的小伙伴们可以戳这篇文章——浅谈网络爬虫中深度优先算法和简单代码实现。今天小编给大家分享网络爬虫中广度优先算法的介绍及其代码实现过程。 广度优先算法和深度优先算法恰好相反,这里继续以上图的二叉树为例。广度优先算法的主要思想是 阅读全文
posted @ 2018-11-13 18:49 dcpeng 阅读(314) 评论(0) 推荐(0) 编辑
摘要: 学过网站设计的小伙伴们都知道网站通常都是分层进行设计的,最上层的是顶级域名,之后是子域名,子域名下又有子域名等等,同时,每个子域名可能还会拥有多个同级域名,而且URL之间可能还有相互链接,千姿百态,由此构成一个复杂的网络。 当一个网站的URL非常多的时候,我们务必要设计好URL,否则在后期的理解、维 阅读全文
posted @ 2018-11-06 13:19 dcpeng 阅读(1229) 评论(0) 推荐(0) 编辑
摘要: 前一阵子小编给大家连续分享了十篇关于Python正则表达式基础的文章,感兴趣的小伙伴可以点击链接进去查看。今天小编给大家分享的是Python正则表达式的简单应用和示例演示,将前面学习的Python正则表达式做一个概括。 下面的栗子是用于提取高考日期,一般来说,我们填写日期都会写2018年6月7日,但 阅读全文
posted @ 2018-10-31 20:10 dcpeng 阅读(280) 评论(0) 推荐(0) 编辑
摘要: 今天分享正则表达式最后一个特殊字符“\d”,具体的教程如下。 1、特殊字符“\d”十分常用,其代表的意思是数字。代码演示如下图所示。 其中“+”的意思是表示连续,在这里代表的意思是连续的数字。但是输出只有“4”这个字符,原因是贪婪模式所致,在上一篇文章中也有提及。 2、如果想要匹配“2004”,则需 阅读全文
posted @ 2018-10-27 11:05 dcpeng 阅读(406) 评论(0) 推荐(0) 编辑
摘要: 继续分享Python正则表达式的基础知识,今天给大家分享的特殊字符是[\u4E00-\u9FA5],这个特殊字符最好能够记下来,如果记不得的话通过百度也是可以一下子查到的。 该特殊字符是固定的写法,其代表的意思是汉字。换句话说,只要字符中是汉字,就可以通过该字符进行匹配,该特殊字符也是用中括号括起来 阅读全文
posted @ 2018-10-21 21:28 dcpeng 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 继续分享Python正则表达式的基础知识,今天给大家分享的特殊字符是“\w”和“\W”,具体的教程如下。 1、“\w”代表的意思是该字符为任意字符,但是和特殊字符“.”的意思不同。“\w”代表的字符主要包括26个大写字母A到Z,即[A-Z]、26个小写字母a到z,即[a-z]、10个阿拉伯数字0到9 阅读全文
posted @ 2018-10-18 14:30 dcpeng 阅读(185) 评论(0) 推荐(0) 编辑