随笔分类 - 爬虫
摘要:谷歌ORC软件下载地址: https://digi.bib.uni-mannheim.de/tesseract/ windows下安装: (参考:https://www.cnblogs.com/zhangxinqi/p/9297292.html#_label2) 然后双击程序安装即可,可以勾选Add
阅读全文
摘要:版权声明:希望与广大Python爱好者,可以相互交流,欢迎留言!欢迎转载(请注明出处) https://blog.csdn.net/EB_NUM/article/details/78394958 我们首先理解滑动验证的原理 滑动验证难点 1.电脑如何自动点击滑动块 2.电脑如何检测 缺口位置(如图;
阅读全文
摘要:第一章: selenium模块的基本使用 问题: selenium模块和爬虫之间具有怎样的关联? - 便捷的获取网站中动态加载的数据 - 便捷实现模拟登陆 什么是selenium模块? - 基于浏览器自动化的一个模块 selenium使用流程: - 环境安装: pip install seleniu
阅读全文
摘要:request模块 - urllib模块 - requests模块 requests模块: python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高. 作用: 模拟浏览器发请求 如何使用: - 指定url - 发起请求 - 获取响应数据 - 持久化存储 第一章: request模
阅读全文