摘要: 221128 1. https://www.cnblogs.com/everfight/p/pandas_read_large_number.html pandas读取大型excel文件 2. https://blog.csdn.net/htbeker/article/details/8654241 阅读全文
posted @ 2022-11-28 18:05 dion至君 阅读(35) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2018-02-14 00:20 dion至君 阅读(128) 评论(0) 推荐(2) 编辑
摘要: 当前获取到wetchat单个聊天框的信息,组成一个列表,那么获取多个列表,如何分别命名比较变化呢?要分解步骤,首先逐个窗口爬取数据,然后分别列为多个列表数据,分别存储到对应联系人的存储文件中。将所有联系人存储到单独一个列表文件中,然后针对联系人信息做信息增量判断,如聊天记录有更新(比如切片列表最后三 阅读全文
posted @ 2022-07-21 10:24 dion至君 阅读(78) 评论(0) 推荐(0) 编辑
摘要: 今天在学习利用uiautomation库进行微信数据爬取,参考链接:https://blog.csdn.net/MicalChen/article/details/120296341。 参考项目:https://github.com/cluic/wxauto/blob/c3d31828288acb3 阅读全文
posted @ 2022-07-19 15:23 dion至君 阅读(388) 评论(0) 推荐(0) 编辑
摘要: 1、 钩子(Hook)是Windows消息处理机制的一个要点(Point)。应用程序可以通过钩子机制截获处理Window消息或是其他一些特定事件。同DOS中断截获处理机制类似,应用程序可以在钩子上设置多个钩子函数,由其组成一个与钩子相关联的指向钩子函数的指针列表(钩子链表)。当钩子所监视的消息出现时 阅读全文
posted @ 2022-07-12 11:44 dion至君 阅读(112) 评论(0) 推荐(0) 编辑
摘要: 如果需要监听wetchat消息为之奈何?就pywinauto而言,有两种监听方式。1. 每次处理信息后,将该聊天框删除,然后再获取聊天列表。2. 获取聊天列表,深拷贝一下,然后再次获取,对比两个列表的顺序,不一样的就是新的消息。当然这种监听方式比较慢。还有大佬提出:可以每次把2-3条信息 做为一个比 阅读全文
posted @ 2022-07-08 13:56 dion至君 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 参考链接:https://www.jianshu.com/p/d9a3372cc04d及https://www.liaoxuefeng.com/wiki/1016959663602400/1183565811281984 psutil适合于在windows系统操作,可以获取各类进程信息,类似于lin 阅读全文
posted @ 2022-07-06 15:35 dion至君 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 1、 部门领导提出需求,想要实现微信爬虫。看了下,目前新注册的手机号已经无法登录微信网页版,只能想办法找找其他方法。 在网上搜了下,现在网络上有大佬介绍,微信PC端可以利用psutil (用于获取微信电脑版的进程信息)和pywinauto (用于自动化控制微信电脑版)两个工具,来实现。可以尝试下,具 阅读全文
posted @ 2022-07-04 15:54 dion至君 阅读(213) 评论(0) 推荐(0) 编辑
摘要: 1、 昨天已经获取到数据,今天发现dataframe数据单列数据存储在一行中,分列不太好分,我上网查了下。从列表转换为dataframe,正常是存储为一行,需要转置下发现确实变成逗号分开的形式了。代码如下: data = get_data() df = pd.DataFrame(data=[data 阅读全文
posted @ 2022-07-03 13:19 dion至君 阅读(154) 评论(0) 推荐(0) 编辑
摘要: 1、 今天继续学习selenium操作。测试了下,目标网站的翻页机制是跳转框输入页码或直接点击页码翻页。两种处理的方式依据不同思路,可以用不同代码实现。先看下第一种的,在20220630随笔中已经有,这里只要看下如何输入页码后回车就行,因为目标网站跳转页面并没有下一页按键(参考链接:https:// 阅读全文
posted @ 2022-07-02 23:21 dion至君 阅读(47) 评论(0) 推荐(0) 编辑
摘要: 0、 最新版的谷歌浏览器驱动放在win10系统中的C:\Program Files\Google\Chrome\Application目录下。 1、 今天在学习selenium中Xpath用法。网上介绍xpath是一种在xml文件中定位的方法,html文件可以看作是xml(xhtml),因此也可以用 阅读全文
posted @ 2022-06-30 17:17 dion至君 阅读(66) 评论(0) 推荐(0) 编辑