C++调用Asprise OCR识别图片
在一个识别软件中发现了Asprise OCR的“身影”,上官网查了一下相关信息,发现功能挺强大的,识别印刷体应该不错,遗憾的是好像不能识别中文,不过不知道它对扭曲后的英文识别能力怎么样,否则的话可以用来识别验证码。在官网下载了C++的Demo,这里记录一下。
1.准备
在官网下载C++的Dll和头文件,创建使用VS2010创建win32工程,将下载的dll和文件拷贝到创建的工程目录。
2.代码
#include <iostream> #include "asprise_ocr_api.h" using namespace std; void testOcr() { const char * libFolder = "."; // 修改为dll所在目录,这里.表示是当前目录 const char * fileImg = "test.png"; // 修改需要识别的图片目录, //加载dll LIBRARY_HANDLE libHandle = dynamic_load_aocr_library(libFolder); //输出当前OCR的版本信息 cout << "Version: " << c_com_asprise_ocr_version() << endl; int setup = c_com_asprise_ocr_setup(false); if (setup != 1) { cerr << "Failed to setup. code: " << setup << endl; return; } // must be of long long type long long ptrToApi = c_com_asprise_ocr_start("eng", OCR_SPEED_FAST, NULL, NULL, NULL); //设置识别参数 if (ptrToApi == 0) { cerr << "Failed to start." << endl; return; } cout << "OCR engine started. " << endl; //开始识别,OCR_OUTPUT_FORMAT_PDF表示输出为PDF文件,PROP_PDF_OUTPUT_FILE为文件名, //PROP_PDF_OUTPUT_TEXT_VISIBLE表示是否在原图片上面显示文字 char * s = c_com_asprise_ocr_recognize(ptrToApi, fileImg, -1, -1, -1, -1, -1, OCR_RECOGNIZE_TYPE_ALL, OCR_OUTPUT_FORMAT_PDF, "PROP_PDF_OUTPUT_FILE=result.pdf,PROP_PDF_OUTPUT_TEXT_VISIBLE=true,PROP_PDF_OUTPUT_IMAGE_FORCE_BW=true,PROP_OUTPUT_SEPARATE_WORDS=false,PROP_PDF_OUTPUT_RETURN_TEXT=text", ",", "="); cout << "Returned: " << s << std::endl; //关闭 c_com_asprise_ocr_stop(ptrToApi); //卸载dll cout << "Unload: " << (dynamic_unload_aocr_library(libHandle) ? "OK" : "Failed") << endl; } int _tmain(int argc, _TCHAR* argv[]) { testOcr(); std::cout << "Press ENTER to exit: "; std::cin.ignore(); return 0; }
3.结果
原图片(图片格式):
识别后的pdf文档: