摘要:
录入资料信息,下载照片,将照片分类放到文件夹。 第一个采用了剪切板工具Ditto,可以方便的拖动一段文字到编辑框中。 第二个是采用按键精灵,采用识图和坐标点击的方式,批量下载照片。 第三个是采用excel,对下载下来的照片,和excel表格进行核对,看是否下载下来,根据的是excel判断是否存在指定 阅读全文
摘要:
以打开淘宝app的搜索页面为例, 先准备工具:Activity管理器 下载地址:https://www.cr173.com/soft/824332.html 备用地址:https://pan.baidu.com/s/1l2266vDbzp0hYcchkUC5jg 提取码: qeve 打开管理器 选择 阅读全文
摘要:
参考资料链接: URLScheme 之 支付宝 支付宝蚂蚁森林能量收集源码-Autojs 1 app.startActivity({ 2 action: "android.intent.action.VIEW", 3 data: "alipays://platformapi/startapp?app 阅读全文
摘要:
Scrapy Shell 我们想要在爬虫中使用xpath、beautifulsoup、正则表达式、css选择器等来提取想要的数据。但是因为scrapy是一个比较重的框架。每次运行起来都要等待一段时间。因此要去验证我们写的提取规则是否正确,是一个比较麻烦的事情。因此Scrapy提供了一个shell,用 阅读全文
摘要:
CrawlSpider 在上一个糗事百科的爬虫案例中。我们是自己在解析完整个页面后获取下一页的url,然后重新发送一个请求。有时候我们想要这样做,只要满足某个条件的url,都给我进行爬取。那么这时候我们就可以通过CrawlSpider来帮我们完成了。CrawlSpider继承自Spider,只不过是 阅读全文
摘要:
JsonItemExporter方式保存数据 或JsonLinesItemExporter保存数据 区别: JsonItemExporter:每次把数据添加到内存中,最后统一写入到磁盘文件中。好处是,存储的是一个满足json规则的数据。坏处是如果数据量比较大,那么比较耗内存。 JsonLinesIt 阅读全文
摘要:
安装和文档: 如果在windows系统下,提示这个错误ModuleNotFoundError: No module named 'win32api',那么使用以下命令可以解决:pip install pypiwin32。 案例: 创建项目: 进入到你想把这个项目存放的目录。然后使用控制台创建项目: 阅读全文
摘要:
tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/ 添加中文的识别库: https://github.com/tesseract-ocr/tessdata/find/master 这个网址中下载chi_sim.traineddata,下 阅读全文