摘要:
大家都知道,我们借助python+selenium来驱动chrome等浏览器时,需要有chromedriver的支持。近来,chrome浏览器的主版本号基本保持每月一更新的频次。当我们的chromedriver版本如果落后chrome主版本超过1,则chromedriver会提示版本不兼容,大概显示 阅读全文
摘要:
小爬一般习惯使用Python来解决爬虫和某些办公自动化场景问题,不过最近却需要实现一个VBA需求:从一堆人员处理的Excel数据记录中,排除某些“用户名称”处理的数据。整个思考过程很有意思,很值得分享下。 这个需求看上去很简单,实际当我们的待排除“用户名称”数超过2时,Excel原生的筛选“自定义筛 阅读全文
摘要:
小爬最近受同事所托,帮忙写个爬虫来获取某个网站的公开数据,该网站没有文件导出功能,后台返回的也不是完美的json格式数据,每页且只能显示不超过22行数据,合计有2200多页,约50000条数据,这就让手工取数变得遥不可及。 小爬原本想用python+selenium思路来低效爬取,实际体验了之后,发 阅读全文
摘要:
小爬最近为了提升自己的常见编程算法,以应对未来日趋复杂的业务场景需求,一直在刷LeetCode的Easy和Medium题,进度很慢,随便一道题都要思考再三,长路漫漫,以至于很长时间都没有更新自动化方面的文章了。不过最近工作中遇到这样一个场景,我们在利用Python驱动SAP GUI时,可能希望多开S 阅读全文
摘要:
小爬上篇文章分析了,SAP凭证批量打印场景中为啥要用到PDF文件解析&拆分。这篇文章,紧接着上一篇,重点谈谈如何用python来做到高效的PDF文件解析&拆分。 小爬使用了python第三方库PyPDF2,它可以轻松的处理pdf文件,它提供了读、写、分割、合并、文件转换等多种操作。小爬试了下,PyP 阅读全文
摘要:
单纯的SAP凭证批量打印,结合SAP Script+python很容易实现。小爬这次遇到的任务有点纠结:我们需要帮档案管理人员批量打印SAP凭证的同时,还要帮助打印这些凭证在OA办公平台中的流程表单+表单对应的各式附件,最后要将两个平台的打印数据进行匹配装订,这是目前的档案管理人员的手工工作模式。经 阅读全文
摘要:
Python操作excel文件的第三方库有很多,小爬就常用openPyxl库来操作已有的excel文件,它对xlsx、xlsm等格式的支持都较好。可openPyxl也有不足,它难以实习VBA中的很多功能。如果我们平日里对VBA语法很熟悉,则可以通过win32com.client来操纵excel文件, 阅读全文
摘要:
小爬最近的一个需求是:将windows系统下的打印任务批量有序给到网络打印机。 用户先从公司的OA(B/S模式)系统下 打印指定内容的表单以及表单中的附件内容。这个问题可以这样分解: 1、抓包,得到OA对应的任务接口,然后利用python requests模拟post请求,获取所有的表单的URL并进 阅读全文
摘要:
最近小爬在用chromedriver.exe结合python selenium这条技术栈做web自动化时发现,driver.maximize_window()可以正常使用,但是driver.minimize_window()却遭遇意外失败: “selenium.common.exceptions.W 阅读全文
摘要:
小爬之前已经就“Python驱动SAP GUI完成自动化”问题写过几篇文章,其核心都是恰当运用SAP GUI Scripting API中元素的属性和方法,来操纵SAP session的元素。下面来看看两个新场景下的新问题。 常见场景一: 我们先来看看对象的changeable属性怎么为我所用来解决 阅读全文