05 2019 档案

摘要:可参考: 阅读全文
posted @ 2019-05-21 11:38 阿布_alone 阅读(196) 评论(0) 推荐(0) 编辑
摘要:tesserocr 是 python 的一个 OCR 库,它是对 tesseract 做的一层 Python API 封装,所以他的核心是tesseract。 tesseract 的安装见 https://www.cnblogs.com/gl1573/p/9876397.html windows 下 阅读全文
posted @ 2019-05-21 11:08 阿布_alone 阅读(403) 评论(0) 推荐(0) 编辑
摘要:Tesseract 是一个开源的 OCR 引擎,可以识别多种格式的图像文件并将其转换成文本,最初由 HP 公司开发,后来由 Google 维护。下载地址:https://digi.bib.uni-mannheim.de/tesseract/ 其中文件名中带有 dev 的为开发版本,不带 dev 的为 阅读全文
posted @ 2019-05-21 10:08 阿布_alone 阅读(2390) 评论(1) 推荐(0) 编辑
摘要:代码: 执行: 阅读全文
posted @ 2019-05-19 11:36 阿布_alone 阅读(1066) 评论(0) 推荐(0) 编辑
摘要:import requests import json r=requests.post('http://127.0.0.1:7788',data=open('5.jpg','rb')) code=json.loads(r.text)['code'] print(code) 阅读全文
posted @ 2019-05-17 20:31 阿布_alone 阅读(829) 评论(1) 推荐(0) 编辑
摘要:''' 爬取去哪儿网所有城市自由行数据 爬取速度过快时会引发服务器返回错误 反反爬策略:设置cookies池和ip代理池以及延长爬虫休眠时间 ''' import requests import time from urllib.parse import quote from multiprocessing import Pool import pymongo import random de... 阅读全文
posted @ 2019-05-16 18:03 阿布_alone 阅读(651) 评论(0) 推荐(0) 编辑
摘要:代码: 阅读全文
posted @ 2019-05-09 23:02 阿布_alone 阅读(771) 评论(0) 推荐(0) 编辑
摘要:一.session 寻找包名和activityname的另外一职中方式 2.python脚本驱动 淘宝列子: 阅读全文
posted @ 2019-05-09 16:29 阿布_alone 阅读(702) 评论(0) 推荐(0) 编辑
摘要:1.抓包 2.代码 抓取: 存储: 阅读全文
posted @ 2019-05-09 15:50 阿布_alone 阅读(377) 评论(0) 推荐(0) 编辑
摘要:转自:https://blog.csdn.net/weixin_42812527/article/details/86682167 阅读全文
posted @ 2019-05-07 17:12 阿布_alone 阅读(849) 评论(0) 推荐(0) 编辑
摘要:这里使用了一个网站的网页做示例,它的源代码中有这么一段 我们的目标是提取图中的json数据,代码如下: 执行结果如下图: 那么 怎么执行一个.js后缀的文件呢 p 获取的就是函数执行的返回值 阅读全文
posted @ 2019-05-05 22:44 阿布_alone 阅读(2783) 评论(0) 推荐(0) 编辑
摘要:安装: 使用: 执行js函数: 执行js函数: 阅读全文
posted @ 2019-05-05 21:17 阿布_alone 阅读(2596) 评论(0) 推荐(0) 编辑
摘要:一.简介 Puppeteer 是 Google 基于 Node.js 开发的一个工具,有了它我们可以通过 JavaScript 来控制 Chrome 浏览器的一些操作,当然也可以用作网络爬虫上,其 API 极其完善,功能非常强大。 而 Pyppeteer 又是什么呢?它实际上是 Puppeteer  阅读全文
posted @ 2019-05-05 12:45 阿布_alone 阅读(7945) 评论(0) 推荐(0) 编辑
摘要:https://github.com/my8100/files/blob/master/scrapydweb/README_CN.md 一.安装配置 1、请先确保所有主机都已经安装和启动 Scrapyd,如果需要远程访问 Scrapyd,则需将 Scrapyd 配置文件中的 bind_address 阅读全文
posted @ 2019-05-04 21:48 阿布_alone 阅读(2308) 评论(0) 推荐(0) 编辑
摘要:1.抓包 打开微信网页版 抓包: 通过分析,我们知道,每次已请求文章只是偏移量offset不一样而已。 还有要注意的是,每个公众号对应的cookies是不一样的,这个也是要小心的 根据接口数据构造请求,便能获取公众号文章了! 2.构造请求,获取数据 数据: 3.另外一个版本 2.手机版 把url和h 阅读全文
posted @ 2019-05-03 17:36 阿布_alone 阅读(2797) 评论(1) 推荐(0) 编辑
摘要:1.安装 下载免安装版本:http://airtest.netease.com/ 文档:http://airtest.netease.com/docs/docs_AirtestIDE-zh_CN/index.html 2.使用 直接运行airtest.exe文件即可 注意:关于连接模拟器(找模拟器的 阅读全文
posted @ 2019-05-03 15:56 阿布_alone 阅读(1567) 评论(0) 推荐(0) 编辑
摘要:一.流程控制 1.选择结构 if-else: switch: 2.循环结构 for: range: 3.跳转语句 continue和break goto: 二.函数 1.自定义函数 分类: 例题:求1.。。100的和 2.defer关键字,延迟操作 三.复合类型 1.指针 简单使用: 使用指针改变所 阅读全文
posted @ 2019-05-02 15:26 阿布_alone 阅读(240) 评论(0) 推荐(0) 编辑
摘要:一.第一个程序 二.基础语法 1.命名 go语言中的函数名、变量名、常量名、类型名、语句标号和包名等所有的命名,都遵循一个简单的命名规则 一个名字必须以一个字母或下划线开头,后面可以跟任意数量的字母、数字或下划线 go区分大小写,hello Hello不同 go语言中有25个关键字,不能用于自定义名 阅读全文
posted @ 2019-05-01 22:55 阿布_alone 阅读(276) 评论(0) 推荐(0) 编辑
摘要:一.下载软件开发包 官网:https://golang.google.cn/ 二. 安装和配置SDK windows使用.msi一键安装 配置环境变量 GOROOT,自动的,默认将go安装到C:/go(可以自定安装位置) GOPATH,自定义的位置,理解为存放go代码的位置 创建并配置好GOPATH 阅读全文
posted @ 2019-05-01 22:13 阿布_alone 阅读(346) 评论(0) 推荐(0) 编辑
摘要:1.安装 或者下载安装指定版本:https://mitmproxy.org/downloads/ 2.配置证书 对于mitmproxy来说,如果想要截获HTTPS请求,就需要设置证书。mitmproxy在安装后会提供一套CA证书,只要客户端信任了mitmproxy提供的证书,就可以通过 mitmpr 阅读全文
posted @ 2019-05-01 21:44 阿布_alone 阅读(2536) 评论(0) 推荐(0) 编辑

TOP
点击右上角即可分享
微信分享提示