摘要:
今天我的ubuntu系统进不去,一启动就陷入紫屏的死循环中,重装了两遍系统还是一样进不去,后来上网查找了各种解决办法,网上都说是显卡的问题,我也不懂什么意思。试了几种方法,终于解决了这个问题,在这里记录下解决方法,以便下次再次碰到。在引导界面按E,进入grub的文本界... 阅读全文
摘要:
常见的正则表达式函数有四个,分别是re.match()、re.search()、全局匹配函数、re.sub()。一、re.match()函数re.match()函数是从源字符串的起始位置开始匹配一个模式,其使用格式为re.match(pattern,string,fl... 阅读全文
摘要:
什么是正则表达式? 正则表达式(Regular Expression)是一种文本模式,在编写处理字符串的程序或网页时,经常会有查找符合某些规则的字符串的需求。正则表达式就是用于描述这些规则的工具,换句话说,正则表达式就是记录文本规则的代码。我们将分别从原子、元子符、... 阅读全文
摘要:
异常主要分为两类,一类是URLError,一类是HTTPError。在异常处理中,我们常常使用try.......except.......语句,try主要执行主要代码,在except捕获异常信息,并进行相应的异常处理。一般来说,产生URLError的原因有以下几点:... 阅读全文
摘要:
使用同一个IP去爬取同一个网站上的网页,久了之后会被该网站服务器屏蔽。这个时候我们就可以使用代理服务器。 (使用代理服务器去爬取某个网站的内容的时候,在对方的网站上,显示的不是我们真实的IP地址,而是代理服务器的IP地址)。给大家推荐一个网址:http... 阅读全文
摘要:
如果要进行客户端与服务器端之间的消息传递,我们可以使用HTTP协议请求进行。 HTTP协议请求主要分为6种类型,各类型的主要作用如下:GET请求:GET请求会通过URL网址传递信息,可以直接在URL中写上要传递的信息,也可以由表单进行传递。如果使用表单进行传递,这表单... 阅读全文
摘要:
有的时候,我们无法爬取一些网页,会出现403错误,因为这些网页为了防止别人恶意采集其信息所以进行了一些反爬虫的设置。那么如果我们向爬取这些网页的信息,应该怎么办呢? 可以设置一些Headers信息,模拟成浏览器去访问这些网站,此时,就能够解决这个问题了... 阅读全文
摘要:
本人以前用的都是python2.7,但看网上很多教程都是以python3为例的,所以便切换版本,导入urllib、lxml、beautifulsoup4等库。下面介绍下两个版本对urllib库的区别,方便以前使用python2.7的能很快适应pytho... 阅读全文
摘要:
学习目标:学习不同的形态学操作,例如腐蚀,膨胀,开运算,闭运算等我们要学习的函数有: cv2.erode(), cv2.dilate(), cv2.morphologyEx()等原理简介: 形态学操作是根据图像形状进行的简单操作。一般情况下对二值化图像进... 阅读全文
摘要:
学习目标:使用自定义的滤波器对图像进行卷积(2D 卷积)学习使用不同的低通滤波器对图像进行模糊一、2D卷积 卷积不是很了解的可以看我上一篇博客,与语音信号一样,我们也可以对 2D 图像实施低通滤波(LPF),高通滤波(HPF)等。低通滤波器就是允许低频信... 阅读全文