摘要: 录入资料信息,下载照片,将照片分类放到文件夹。 第一个采用了剪切板工具Ditto,可以方便的拖动一段文字到编辑框中。 第二个是采用按键精灵,采用识图和坐标点击的方式,批量下载照片。 第三个是采用excel,对下载下来的照片,和excel表格进行核对,看是否下载下来,根据的是excel判断是否存在指定 阅读全文
posted @ 2021-08-12 17:28 薇薇前进 阅读(91) 评论(0) 推荐(0) 编辑
摘要: 以打开淘宝app的搜索页面为例, 先准备工具:Activity管理器 下载地址:https://www.cr173.com/soft/824332.html 备用地址:https://pan.baidu.com/s/1l2266vDbzp0hYcchkUC5jg 提取码: qeve 打开管理器 选择 阅读全文
posted @ 2020-01-10 13:45 薇薇前进 阅读(9951) 评论(0) 推荐(0) 编辑
摘要: 参考资料链接: URLScheme 之 支付宝 支付宝蚂蚁森林能量收集源码-Autojs 1 app.startActivity({ 2 action: "android.intent.action.VIEW", 3 data: "alipays://platformapi/startapp?app 阅读全文
posted @ 2020-01-10 09:53 薇薇前进 阅读(2329) 评论(0) 推荐(0) 编辑
摘要: Scrapy Shell 我们想要在爬虫中使用xpath、beautifulsoup、正则表达式、css选择器等来提取想要的数据。但是因为scrapy是一个比较重的框架。每次运行起来都要等待一段时间。因此要去验证我们写的提取规则是否正确,是一个比较麻烦的事情。因此Scrapy提供了一个shell,用 阅读全文
posted @ 2019-03-13 10:00 薇薇前进 阅读(193) 评论(0) 推荐(0) 编辑
摘要: CrawlSpider 在上一个糗事百科的爬虫案例中。我们是自己在解析完整个页面后获取下一页的url,然后重新发送一个请求。有时候我们想要这样做,只要满足某个条件的url,都给我进行爬取。那么这时候我们就可以通过CrawlSpider来帮我们完成了。CrawlSpider继承自Spider,只不过是 阅读全文
posted @ 2019-03-13 09:39 薇薇前进 阅读(334) 评论(0) 推荐(0) 编辑
摘要: JsonItemExporter方式保存数据 或JsonLinesItemExporter保存数据 区别: JsonItemExporter:每次把数据添加到内存中,最后统一写入到磁盘文件中。好处是,存储的是一个满足json规则的数据。坏处是如果数据量比较大,那么比较耗内存。 JsonLinesIt 阅读全文
posted @ 2019-03-12 14:25 薇薇前进 阅读(1219) 评论(0) 推荐(0) 编辑
摘要: 安装和文档: 如果在windows系统下,提示这个错误ModuleNotFoundError: No module named 'win32api',那么使用以下命令可以解决:pip install pypiwin32。 案例: 创建项目: 进入到你想把这个项目存放的目录。然后使用控制台创建项目: 阅读全文
posted @ 2019-03-12 14:08 薇薇前进 阅读(367) 评论(0) 推荐(0) 编辑
摘要: tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/ 添加中文的识别库: https://github.com/tesseract-ocr/tessdata/find/master 这个网址中下载chi_sim.traineddata,下 阅读全文
posted @ 2019-03-01 17:46 薇薇前进 阅读(3519) 评论(0) 推荐(0) 编辑
摘要: 代码 阅读全文
posted @ 2019-02-28 13:22 薇薇前进 阅读(9584) 评论(0) 推荐(0) 编辑
摘要: 在登录豆瓣中,视频中可以直接获取复选框并勾选,可是我自己测试并行。查百度发现是因为框架的原因。登录框在框架内,要先进入框架才可以操作里面的元素。 修改代码如下: 关于driver.switch_to.frame(0),我们可以转到声明中查看用法 可以使用id,name或index和WebElemen 阅读全文
posted @ 2019-02-28 09:21 薇薇前进 阅读(365) 评论(0) 推荐(0) 编辑