Fork me on GitHub

【2种方式:批量重命名发票等票据图片】 OCR识别图片内容以发票号码和开票日期批量重命名照片图片

眼见为实

 

发票等图片批量重命名方法1_位置固定内容不确定_裁剪分区_OCR批量命名图片_录屏视频 优爱酷批量图像文字表格识别系统OCR

二.实现

图片

优爱酷批量图像文字表格识别系统OCR | 技术突破

 

一款基于开放互操作人工智能的AI深度学习的OCR软件。

 

图片 支持单图OCR 以及 自由截屏OCR识别、批量OCR、动态OCR(定时OCR); 

图片 支持五大场景结构化识别;

图片 支持倾斜图像自动纠偏;

图片 支持识别成文本文档(.txt)、Excel(.xlsx)、格式; 

图片 支持表格图片识别成Word文档(.docx)格式,支持多表格识别。

 

优爱酷使用AI技术将无比庞大的文字识别功能从网络端,轻量化到桌面端,本地化OCR识别库,本地识别文字,使您无需顾虑涉密信息或隐私数据的泄露。

 

 

三.功能支持

1、单图OCR

单图OCR 以及 自由截屏OCR识别

受条件所限,很多时候,能接触到的原始资料被固化或限制了:

只可查看,无法复制;

只有图片,没有原始文档;

扫描件,无法编辑整理;

等等情况,无法直接使用,人工重新录入工作量巨大、费事费力。

那有没有解决的办法呢?优爱酷OCR来帮忙!

有图片/照片/扫描件/PDF/电脑截屏等显示器能显示的信息,均可瞬间变活!

 

图片

2、OCR场景

通用文字OCR、分区OCR、表格文档OCR

表格识别OCR(Table OCR):轻松将表格图片、照片、截图、截屏等图像批量识别为结构化的Excel表格(.xlsx);

定制OCR裁剪分区:可将图片比例一致、格式相对固定的的图像识别为结构化的Excel表格(.xlsx);

定制OCR提取字段:可将文字格式相对固定,但格局位置不固定的图像识别为结构化的Excel表格(.xlsx);

定制OCR裁剪分区:可将图片比例一致、格式相对固定的的图像识别为结构化的Excel表格(.xlsx);

定制OCR表格图片:可将图文混排,尤其是图片表格的情况,如大小比例不尽相同、格式不固定的图片OCR为Word图文表格文档(.docx)。

高效、自由应对六大类OCR场景:

1.通用类OCR(General OCR)

支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,快速实现各种文档电子化;

2.表格识别OCR(Table OCR)

采用先进的AI人工智能技术,基于推理模型和表格结构模型大大提高表格识别的精度和准确率;

3.证件类OCR(Card OCR)

支持身份证、驾驶证、行驶证、护照、车牌等图片上证件有效信息的自动识别和关键字段结构化提取;

4.票据类OCR(Receipt OCR)

支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动化文字识别和结构化提取;

5.行业类(Domain OCR)

支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别;

6.定制模板OCR(Custom OCR)

支持用户自定义识别模板,指定需要文字识别的关键字段,实现用户特定格式图片的自动化文字识别和结构化提取。

 

图片

OCR场景定制

 (1)

OCR关键字段提取Excel


图片

操作演示:关键字段OCR

 

图片

关键字段编辑器

字段定制:

  • 支持自由添加、删除,导入、导出;

  • 支持拖拽排序;

  • 支持指定字符类型:文本、日期、数字等;

  • 支持选择包含或不包含前缀、后缀。

定制完的字段名称,即为最终OCR识别后的Excel表格的表头。

识别后的Excel便于编辑、复制粘贴、统计分析等。

 

应用场景:

关键字段提取OCR,适用于类似扫描件,需要识别的主体区域位置不固定的情况。


 (2)

OCR分区裁剪为Excel


图片

操作演示:分区裁剪OCR

 

图片

图片

分区裁剪编辑器

 

分区裁剪:

  • 支持自由添加、删除选区,可自由命名;

  • 支持鼠标画框选中需要的文字区域;

  • 支持拖拽移动位置;

  • 支持不同模板

     

选区的命名,即为最终OCR识别后的Excel表格的表头。

识别后的Excel便于编辑、复制粘贴、统计分析等。

 

应用场景:

分区裁剪OCR,适用于相同模板的网络截图、固定位置的文字标注的,需要识别的主体区域位置固定不变的情况。


 (3)

文字表格OCR为Word


图片操作演示:图片OCR为Word表格

表格OCR:

  • 支持识别所有文字,即文字与表格的混合OCR识别;

  • 支持合并单元格识别,可选是否合并;

  • 支持一图多表格的OCR识别;

  • 支持批量图片识别,按添加图片的先后顺序将OCR识别的Word内容进行合并;

  • 支持表格背景颜色的识别与标注,可选是否标注;

  • 支持自动清除单元格换行符,可选是否清除;

  • 可指定最小的行高度,以便忽略不需要的表格。

     

识别后的Word文档便于进一步修改、编辑、复制粘贴,节省大量的人工编制文字或表格的时间。

 

应用场景:

文字表格OCR,适用于文字表格混排的任意图片的识别、对需要识别的主体区域位置没有特定要求,仅需表格线条分明即可。

 

图片

 

3、批量OCR

多线程、多任务,支持同步合并

1、支持识别为文本文档.txt、Excel表格.xlsx、Word文档.docx格式;

2、支持多线程、并行任务功能,VIP尊享版支持最多同时并行处理40项任务,速度看到见,提升速度40倍;

3、支持对场景Excel表格备注出处,便于比对修正;

4、自动合并OCR识别内容功能,可对批量识别的任务,实时进行OCR识别文件的自动拼接合并。

 

图片

 

4、动态OCR

对指定屏幕区域,实时、动态OCR,支持同步翻译

1、自动记录文字出现开始时间、结束时间,动态识别文字,实时滚动,可直接编辑,并可导出 Excel 格式编辑保存;

2、增加支持自由设置选区,定时时间间隔,倒计时等;

3、增加支持翻译引擎选择,实现同步翻译,支持语言包括:

4、支持前置操作设置,仿人工点击的单击、双击操作,进行网页链接跳转、PPT、PDF等文档翻页等操作,可设置等待时间,而后再进行OCR识别

 

应用场景:

针对短视频文案、音频歌词、电影字幕、动态网页、PPT幻灯片、在线文档等OCR文字提取等应用场景而定制开发。

图片

 

图片

5、通用设置

裁剪、缩放,智能倾斜矫正

1、支持保存目录设置

2、支持线程数量设置

3、预处理功能,可对超大图片预先进行按比例缩放,或指定宽度或高度

4、区域OCR功能,可对相同模板类型的图片进行批量裁剪区域进行识别,大大提供目的性和准确性

5、支持倾斜图像自动纠偏

 

图片

 

6、日志记录

一切尽在掌握

支持两种日志记录方式:

1、窗口日志,随时可以查看

2、文档日志,表格格式,可用作统计分析

 

图片

窗口日志

 

图片

CSV文档日志

四.下载使用

 

图片 安装教程

  1. 从发行版 http://www.uicool.cn/UiCoolOCR/ 选择自己需要的版本,或点击底部【查看原文】下载

图片

  1. 绿色软件,解压缩后即可右键“以管理员权限运行”,运行“优爱酷批量图像文字识别系统(OCR).exe”

  2. 即可开始使用

图片 运行环境

64位 操作系统如 Windows7 / Windows8 / Windows8.1 / Windows10 / Windows11

为了节省大家的时间,请确保您的电脑已安装软件运行所需环境软件:

【1-操作系统】:Win7或以上(Win7、Win8、Win8.1、推荐Win10);

【2-Net Framework框架】:4.6.1或以上版本(或请系统更新至最新版,win10自带不需要手动安装); 下载地址:https://dotnet.microsoft.com/download/dotnet-framework/net461

【所有版本.NET Framework 微软官方下载】 https://dotnet.microsoft.com/download/visual-studio-sdks?utm_source=getdotnetsdk&utm_medium=referral

【3-Visual C++ 运行库】:Microsoft Visual C++ 2015-2019 Redistributable (x64); 下载地址:https://aka.ms/vs/16/release/vc_redist.x64.exe

posted @ 2024-05-30 23:59  优爱酷  阅读(149)  评论(0编辑  收藏  举报