随笔分类 -  爬虫

摘要:谷歌ORC软件下载地址: https://digi.bib.uni-mannheim.de/tesseract/ windows下安装: (参考:https://www.cnblogs.com/zhangxinqi/p/9297292.html#_label2) 然后双击程序安装即可,可以勾选Add 阅读全文
posted @ 2021-04-23 11:08 蓝蓝的白云天! 阅读(57) 评论(0) 推荐(0) 编辑
摘要:版权声明:希望与广大Python爱好者,可以相互交流,欢迎留言!欢迎转载(请注明出处) https://blog.csdn.net/EB_NUM/article/details/78394958 我们首先理解滑动验证的原理 滑动验证难点 1.电脑如何自动点击滑动块 2.电脑如何检测 缺口位置(如图; 阅读全文
posted @ 2021-04-23 10:47 蓝蓝的白云天! 阅读(763) 评论(0) 推荐(0) 编辑
摘要:第一章: selenium模块的基本使用 问题: selenium模块和爬虫之间具有怎样的关联? - 便捷的获取网站中动态加载的数据 - 便捷实现模拟登陆 什么是selenium模块? - 基于浏览器自动化的一个模块 selenium使用流程: - 环境安装: pip install seleniu 阅读全文
posted @ 2021-04-21 11:09 蓝蓝的白云天! 阅读(49) 评论(0) 推荐(0) 编辑
摘要:request模块 - urllib模块 - requests模块 requests模块: python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高. 作用: 模拟浏览器发请求 如何使用: - 指定url - 发起请求 - 获取响应数据 - 持久化存储 第一章: request模 阅读全文
posted @ 2021-03-30 20:04 蓝蓝的白云天! 阅读(205) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示