04 2022 档案

摘要:爬虫系列:爬虫验证码识别读取验证码与训练 Tesseract 在上一篇文章中我们介绍了使用 Tesseract 如何识别格式规范的文字,在这篇文章中我们将详细介绍使用 Tesseract 如何识别图像验证码。 虽然大多数人对单词“CAPTCHA”都很熟悉,但是很少人知道它的具体含义:全自动区分计算机和人类的图灵测试(Com 阅读全文
posted @ 2022-04-29 17:29 爬虫程序大魔王 阅读(738) 评论(0) 推荐(0) 编辑
摘要:爬虫系列:在 Python 中用 Selenium 执行 JavascriptSelenium 是一个强大的网络数据采集工具,其最初是为网站自动化测试而开发的。近几年,它还被广泛用于获取精确的网站快照,因为它们可以直接运行在浏览器上。Selenium 可以让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。 Selenium 自己不带浏览器,它 阅读全文
posted @ 2022-04-08 17:26 爬虫程序大魔王 阅读(505) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示