摘要:
一、版本情况 python以丰富的三方类库取得了众多程序员的认可,但也因此带来了众多的类库版本问题,本文总结的内容是基于最新的类库版本。 1、scrapy版本:1.1.0 D:\python\Spider-master\ccpmess>scrapy version -v Scrapy : 1.1.0 阅读全文
摘要:
以下内容转自博客:http://blog.chinaunix.net/uid-22670933-id-1771613.html。 一、字符编码是怎么回事 0. 概念 字节是计算机的最基本存储单位,一个字节包括8个位. 字符是一种文字的基本单位,比如'A' 是一个字符,'汉' 也是一个字符. 1. 计 阅读全文
摘要:
以下转自于:wklken的博客,写的非常好的一段有关编码的总结。Python-进阶-编码处理小结 整理下python编码相关的内容 注意: 以下讨论为Python2.x版本, Py3k的待尝试 开始 用python处理中文时,读取文件或消息,http参数等等 一运行,发现乱码(字符串处理,读写文件, 阅读全文
摘要:
以下内容转载自: http://in355hz.iteye.com/blog/1860787 最近业务中需要用 Python 写一些脚本。尽管脚本的交互只是命令行 + 日志输出,但是为了让界面友好些,我还是决定用中文输出日志信息。 很快,我就遇到了异常: UnicodeEncodeError: 'a 阅读全文
摘要:
一、版本信息 Firefox 最新版本V46.0.1 Fiddler 最新版本V4.6.2.3 二、错误信息 开启fiddlers的https协议捕获的方法,百度上可以查到不再赘述,直接放张图(Tools - Fiddlers Options……)。 开启https协议捕获之后,用firefox访问 阅读全文
摘要:
一、pytesseract介绍 1、pytesseract说明 pytesseract最新版本0.1.6,网址:https://pypi.python.org/pypi/pytesseract Python-tesseract is a wrapper for google's Tesseract- 阅读全文
摘要:
1、背景 前文已经简要介绍tesseract ocr引擎的安装及基本使用,其中提到使用-l eng参数来限定语言库,可以提高识别准确率及识别效率。 本文将针对某个网站的验证码进行样本训练,形成自己的语言库,来提高验证码识别率。 2、准备工具 tesseract样本训练有一个官方流程说明,https: 阅读全文
摘要:
1、Tesseract介绍 tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源码可以在这里下载。 实际使用tesseract ocr也有两种方式:1- 动态库方式 libtesse 阅读全文
摘要:
1、背景 随着华为手机的销量加大,华为云的捆绑服务使用量也越来越广泛,华为云支持自动同步照片、通讯录、记事本等,用着确实也挺方便的,云服务带来方便的同时,也带来了数据管理风险。华为目前只提供一个www.hicloud.com网站来管理数据,不提供windows平台的同步工具,数据管理和同步非常不方便 阅读全文
摘要:
python 下有多个有关时间的模块,分别是time、datetime、calendar,今天重点讨论下time写法。 其中time模块,主要有以下方法: ltime=time.time() 获取当前系统时间,返回float型数值时间戳(当前时间相对于1970.1.1 00:00:00以秒计算的偏移 阅读全文