如何用QTP获取网页中的图片验证码(转载）

大家在使用QTP进行自动化测试的过程中经常会遇到图片验证码的问题——大家所关心的就是如何解决此类问题。

这里我们首先要去了解为什么会有图片验证码。其实验证码的本质作用就是防止有人利用工具（灌水机、注册机，当然也不小心包括了我们的自动化测试工具）恶

意猜解登陆或者不停的注册和灌水的。

解决图片验证码的思路：利用QTP9.5的OCR机制抓取文本内容。

在QTP9.5中，对象识别能力有了进一步改善，其中针对文本识别方面进行了优化，引入了ABBYY公司的OCR解决方案——这个相关的功能体现在QTP菜单的

“Tools-->Options-->General--Use text recognition mechanisms in this order”里，详细内容后面会有具体介绍。先来看看ABBYY是何许公司，登录他们

的官方网站可以看到一段相关介绍：“ABBYY是世界OCR（光学字符识别）、ICR（手写体识别）和语言软件的领航者。ABBYY 致力于人工智能(AI)和语言软件开

发。提供全套文档识别，转换和数据捕获技术的产品解决方案。”如果你使用过图像文档转换的软件，一定会听说过FineReader OCR Professional ，其实它就是A

BBYY公司的产品，用官方的说法就是“将通过扫描仪、MFP 或数码相机生成的图像快速转换为可编辑和可搜索的电子格式，而且识别率很高”，说白了就是可以借

助它先进的OCR机制“读”出图片里的文本内容，并转换为PDF之类的文档。

有了ABBYY这么强大的背后支持，QTP自然底气十足，那么QTP到底如何以OCR机制识别文本呢？我们首先先了解一下什么是OCR。
打开“百度百科_OCR”，它的说明：“OCR（Optical Character Recognition，光学字符识别），是属于图型识别（Pattern Recognition，PR）的一门学问。其目的就是要让计算机知道它到底看到了什么，尤其是文字资料。由于OCR是一门与识别率拔河的技术，因此如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题，ICR（Intelligent Character Recognition）的名词也因此而产生。而根据文字资料存在的媒体介质不同，及取得这些资料的方式不同，就衍生出各式各样、各种不同的应用。”这里有个关键词：“正确率”，也就是“识别率”——既然不能够总是100%，我们自然不可能完全寄希望于通过QTP能够每次100%正确的去识别图片里的文本。尤其是“道高一尺魔高一丈”的今天，验证码加入了大量的干扰素，如扭曲、变形、错位、随机背景花纹，给OCR识别增加了很多难度——本来就不希望被软件识别到嘛。

了解了OCR之后，我们再来看看QTP对应的这个设置。如前面所说，通过QTP菜单的“Tools-->Options”选中到“General--Use text recognition mechanisms in this order”，这里的四个选项就是对应的不同设置。我们看看帮助的描述（我做了翻译）：
=================================
使用文本识别机制

指定QTP在采用 “文本”或者“文本区域” 的检查点或输出值的步骤时，捕获文本内容所使用的文本识别机制。
以下有三种识别方式：
1、先使用Windows API，再使用OCR（默认）。
指示QTP首先尝试以基于Windows API的机制从对象上直接获取文本内容。如果未获取到文本（比如，文本属于图片的一部分），QTP就会使用OCR的机制尝试获取这段文本。
强烈建议在使用中日韩（象形文字）、英的语言环境下采用这个设置。

2、先使用OCR，再使用Windows API。
指示QTP首先尝试使用OCR机制从对象上去获取文本。如果未获取到文本，QTP就会以Windows API的机制去获取文本内容。

3、仅使用Windows API方式。
指示QTP仅采用基于Windows API的机制从对象上获取文本内容。

4、仅使用OCR的方式。
指示QTP仅采用基于OCR的机制从对象上获取文本内容。
在使用Windows Vista要使用这种方式。

还有一种更简单的解决办法就是自己输入验证码中的信息！
input =inputbox("")

posted @ 2009-07-30 16:55 粉嫩猪阅读(1831) 评论(0) 编辑收藏举报

刷新页面返回顶部

cherry

每天进步一点点~一步一步学习测试

如何用QTP获取网页中的图片验证码(转载）

公告