摘要: https://github.com/everywan/blog/blob/master/Program/Language/Python/ThreadAndProcess.md 阅读全文
posted @ 2018-05-11 19:18 thought 阅读(108) 评论(0) 推荐(0) 编辑
摘要: https://github.com/everywan/blog/blob/master/Program/Language/Python/Coroutines.md 阅读全文
posted @ 2018-05-11 19:17 thought 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 先说结论:Request和Response可以设置gzip压缩从而节省流量/带宽,这是一个不常见的问题。具体可见连接:HTTP 协议之压缩 最近测试代理服务器时,意外的发现使用urlopen请求百度首页时,会返回两种结果,一种是正常的百度首页html源码(以下简称正常结果),一种是'乱码'。样例如下 阅读全文
posted @ 2017-05-26 18:40 thought 阅读(4360) 评论(0) 推荐(0) 编辑
摘要: 在linux上部署服务时,通常教程不会提供给检测服务没有部署成功的方法,有时候我们软件配置没问题,但是由于一些其他的问题导致服务连不上,这就很蛋疼了。 通常,对于网络服务,我们只需要检测端口是否OK就行了。简单情况下,我们使用ping+telnet就可以检测端口是否正常开启了。但是对于某些UDP端口 阅读全文
posted @ 2017-05-24 21:49 thought 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 本文总结了作者使用centos最小化安装时,碰到的问题和解决方案。 附录: 阅读全文
posted @ 2017-05-21 00:57 thought 阅读(2527) 评论(0) 推荐(0) 编辑
摘要: 本文分为三部分,第一部分是在阿里云的ECS上安装Privoxy,第二部分是在AWS的EC2上安装Privoxy,第三部分是Privoxy的配置。 第一部分:阿里云ECS安装Privoxy 配置yum源为阿里云的源,然后可以直接使用yum安装Privoxy。 安装完毕后,需要将privoxy文件的权限 阅读全文
posted @ 2017-05-19 12:31 thought 阅读(7978) 评论(0) 推荐(0) 编辑
摘要: 可以先看下这篇文章:http://www.cnblogs.com/jiangtu/articles/6662043.html 原篇是转载的:http://www.python-tab.com/html/2015/pythonhexinbiancheng_0415/946.html (去掉连字符 - 阅读全文
posted @ 2017-04-03 16:47 thought 阅读(1001) 评论(0) 推荐(0) 编辑
摘要: 不了解编码的,需要先补下:http://www.cnblogs.com/jiangtu/p/6245264.html 在学习&使用scrapy抓取网上信息时,发现scrapy 会将含有中文的field输出为 unicode字符串形式。 这个原因的根本是,在python中使用json序列化时,如果使用 阅读全文
posted @ 2017-03-28 23:38 thought 阅读(4535) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/haiross/article/details/36189103 可以先看下这篇文章。。写的比较用心和详细并且高深。。我只是记流水账的。 直到今天我才注意到 shell 采用不同编码会导致这么蛋疼的问题。。这半天时间算是认栽了吧。。 首先,Windows的默 阅读全文
posted @ 2017-03-24 02:36 thought 阅读(1727) 评论(0) 推荐(0) 编辑
摘要: OCR识别推荐两个软件: 1. Tesseract:一个开源的,由谷歌维护的OCR软件。 2. Onenote:微软Office附带或者可以自己独立安装。 3. ONOM:别人封装的onenote api接口 这次讲Onenote实现的OCR识别。github地址:https://github.co 阅读全文
posted @ 2017-03-08 22:54 thought 阅读(1858) 评论(4) 推荐(0) 编辑