薇薇前进

2021年8月12日

摘要：录入资料信息，下载照片，将照片分类放到文件夹。第一个采用了剪切板工具Ditto，可以方便的拖动一段文字到编辑框中。第二个是采用按键精灵，采用识图和坐标点击的方式，批量下载照片。第三个是采用excel，对下载下来的照片，和excel表格进行核对，看是否下载下来，根据的是excel判断是否存在指定阅读全文

posted @ 2021-08-12 17:28 薇薇前进阅读(109) 评论(0) 推荐(0)

2020年1月10日

Autojs的intent使用-获取Activity

摘要：以打开淘宝app的搜索页面为例, 先准备工具：Activity管理器下载地址：https://www.cr173.com/soft/824332.html 备用地址：https://pan.baidu.com/s/1l2266vDbzp0hYcchkUC5jg 提取码: qeve 打开管理器选择阅读全文

posted @ 2020-01-10 13:45 薇薇前进阅读(10439) 评论(0) 推荐(0)

Autojs支付宝Scheme

摘要：参考资料链接： URLScheme 之支付宝支付宝蚂蚁森林能量收集源码-Autojs 1 app.startActivity({ 2 action: "android.intent.action.VIEW", 3 data: "alipays://platformapi/startapp?app 阅读全文

posted @ 2020-01-10 09:53 薇薇前进阅读(2453) 评论(0) 推荐(0)

2019年3月13日

Scrapy Shell

摘要： Scrapy Shell 我们想要在爬虫中使用xpath、beautifulsoup、正则表达式、css选择器等来提取想要的数据。但是因为scrapy是一个比较重的框架。每次运行起来都要等待一段时间。因此要去验证我们写的提取规则是否正确，是一个比较麻烦的事情。因此Scrapy提供了一个shell，用阅读全文

posted @ 2019-03-13 10:00 薇薇前进阅读(203) 评论(0) 推荐(0)

CrawlSpider爬虫

摘要： CrawlSpider 在上一个糗事百科的爬虫案例中。我们是自己在解析完整个页面后获取下一页的url，然后重新发送一个请求。有时候我们想要这样做，只要满足某个条件的url，都给我进行爬取。那么这时候我们就可以通过CrawlSpider来帮我们完成了。CrawlSpider继承自Spider，只不过是阅读全文

posted @ 2019-03-13 09:39 薇薇前进阅读(355) 评论(0) 推荐(0)

2019年3月12日

JsonItemExporter和JsonLinesItemExporter保存数据

摘要： JsonItemExporter方式保存数据或JsonLinesItemExporter保存数据区别： JsonItemExporter：每次把数据添加到内存中，最后统一写入到磁盘文件中。好处是，存储的是一个满足json规则的数据。坏处是如果数据量比较大，那么比较耗内存。 JsonLinesIt 阅读全文

posted @ 2019-03-12 14:25 薇薇前进阅读(1254) 评论(0) 推荐(0)

Scrapy的一个简单入门

摘要：安装和文档: 如果在windows系统下，提示这个错误ModuleNotFoundError: No module named 'win32api'，那么使用以下命令可以解决：pip install pypiwin32。案例: 创建项目：进入到你想把这个项目存放的目录。然后使用控制台创建项目：阅读全文

posted @ 2019-03-12 14:08 薇薇前进阅读(379) 评论(0) 推荐(0)

2019年3月1日

Tesseract的简单使用

摘要： tesseract下载地址：https://digi.bib.uni-mannheim.de/tesseract/ 添加中文的识别库： https://github.com/tesseract-ocr/tessdata/find/master 这个网址中下载chi_sim.traineddata，下阅读全文

posted @ 2019-03-01 17:46 薇薇前进阅读(3706) 评论(0) 推荐(0)

2019年2月28日

UnicodeEncodeError: 'gbk' codec can't encode character '\ufeff' in position 0: illegal multibyte sequence

摘要：代码阅读全文

posted @ 2019-02-28 13:22 薇薇前进阅读(9711) 评论(0) 推荐(0)

selenium切换iframe

摘要：在登录豆瓣中,视频中可以直接获取复选框并勾选,可是我自己测试并行。查百度发现是因为框架的原因。登录框在框架内，要先进入框架才可以操作里面的元素。修改代码如下：关于driver.switch_to.frame(0)，我们可以转到声明中查看用法可以使用id，name或index和WebElemen 阅读全文

posted @ 2019-02-28 09:21 薇薇前进阅读(370) 评论(0) 推荐(0)

公告