上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 49 下一页
摘要: 代码: 代码: 代码: 阅读全文
posted @ 2019-06-26 23:43 阿布_alone 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 可参考: 阅读全文
posted @ 2019-05-21 11:38 阿布_alone 阅读(192) 评论(0) 推荐(0) 编辑
摘要: tesserocr 是 python 的一个 OCR 库,它是对 tesseract 做的一层 Python API 封装,所以他的核心是tesseract。 tesseract 的安装见 https://www.cnblogs.com/gl1573/p/9876397.html windows 下 阅读全文
posted @ 2019-05-21 11:08 阿布_alone 阅读(392) 评论(0) 推荐(0) 编辑
摘要: Tesseract 是一个开源的 OCR 引擎,可以识别多种格式的图像文件并将其转换成文本,最初由 HP 公司开发,后来由 Google 维护。下载地址:https://digi.bib.uni-mannheim.de/tesseract/ 其中文件名中带有 dev 的为开发版本,不带 dev 的为 阅读全文
posted @ 2019-05-21 10:08 阿布_alone 阅读(2349) 评论(1) 推荐(0) 编辑
摘要: 代码: 执行: 阅读全文
posted @ 2019-05-19 11:36 阿布_alone 阅读(1059) 评论(0) 推荐(0) 编辑
摘要: import requests import json r=requests.post('http://127.0.0.1:7788',data=open('5.jpg','rb')) code=json.loads(r.text)['code'] print(code) 阅读全文
posted @ 2019-05-17 20:31 阿布_alone 阅读(814) 评论(1) 推荐(0) 编辑
摘要: ''' 爬取去哪儿网所有城市自由行数据 爬取速度过快时会引发服务器返回错误 反反爬策略:设置cookies池和ip代理池以及延长爬虫休眠时间 ''' import requests import time from urllib.parse import quote from multiprocessing import Pool import pymongo import random de... 阅读全文
posted @ 2019-05-16 18:03 阿布_alone 阅读(619) 评论(0) 推荐(0) 编辑
摘要: 代码: 阅读全文
posted @ 2019-05-09 23:02 阿布_alone 阅读(766) 评论(0) 推荐(0) 编辑
摘要: 一.session 寻找包名和activityname的另外一职中方式 2.python脚本驱动 淘宝列子: 阅读全文
posted @ 2019-05-09 16:29 阿布_alone 阅读(693) 评论(0) 推荐(0) 编辑
摘要: 1.抓包 2.代码 抓取: 存储: 阅读全文
posted @ 2019-05-09 15:50 阿布_alone 阅读(369) 评论(0) 推荐(0) 编辑
上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 49 下一页
TOP