C#使用PaddleOCR进行图片文字识别✨

合集 - C#(93)

1.使用C#将几个Excel文件合并去重分类2023-11-15 2.C#使用SqlSugar操作MySQL数据库实现简单的增删改查2023-11-16 3.C#中的类和继承2023-11-17 4.C#中的virtual和override关键字2023-11-17 5.C#中的属性2023-11-20 6.C#winform中使用SQLite数据库2023-11-23 7.C#简化工作之实现网页爬虫获取数据2023-11-27 8.C#中的委托（一）2023-11-29 9.C#中的ref关键字2023-11-29 10.C#中out关键字2023-11-29 11.C#中内置的泛型委托Func与Action2023-12-04 12.在winform blazor hybrid中绘图2023-12-13 13.使用C#如何监控选定文件夹中文件的变动情况？2023-12-28 14.C#设计模式之策略模式2024-01-02 15.由浅入深理解C#中的事件2024-01-04 16.C#设计模式之观察者模式2024-01-04 17.C#设计模式之单例模式2024-01-08 18.C#基于ScottPlot进行可视化2024-01-13 19.C#使用MiniExcel导入导出数据到Excel/CSV文件2024-02-10 20.winform实现最小化至系统托盘2024-02-19 21.C#使用Bogus生成测试数据2024-02-27 22.SemanticKernel如何基于自有数据聊天2024-03-05 23.在winform中如何嵌入第三方软件窗体✨2024-03-07 24.在winform中如何实现双向数据绑定？2024-03-18 25.自己动手做一个批量doc转换为docx文件的小工具2024-03-20 26.WPF中动画教程（DoubleAnimation的基本使用）2024-04-01 27.WPF动画教程（PointAnimationUsingPath的使用）2024-04-03

28.C#使用PaddleOCR进行图片文字识别✨2024-04-09

29.WPF基础：在Canvas上绘制图形2024-04-16 30.WPF/C#：让绘制的图形可以被选中并将信息显示在ListBox中2024-04-19 31.使用归一化盒过滤器对图像进行平滑处理2024-04-20 32.WPF/C#：如何显示具有层级关系的数据2024-04-22 33.将彩色图转化为灰度图及其原理介绍2024-04-23 34.WPF/C#：ProgressBar的基本使用2024-05-08 35.在VB.NET项目中使用C#编写的代码2024-05-21 36.WPF/C#：理解与实现WPF中的MVVM模式2024-05-28 37.SemanticKernel：添加插件2024-06-06 38.Avalonia：一个.NET跨平台UI框架2024-06-10 39.WPF/C#：异常处理2024-06-12 40.WPF/C#：程序关闭的三种模式2024-06-12 41.wpfui：一个开源免费具有现代化设计趋势的WPF控件库2024-06-13 42.WPF/C#：如何将数据分组显示2024-06-17 43.WPF/C#:更改界面的样式2024-06-17 44.LiveCharts2：简单灵活交互式且功能强大的.NET图表库2024-06-18 45.WPF/C#：显示分组数据的两种方式2024-06-19 46.WPF/C#：在DataGrid中显示选择框2024-06-20 47.WPF/C#：数据绑定到方法2024-06-21 48.WPF/C#：BusinessLayerValidation2024-06-25 49.WPF/C#：如何实现拖拉元素2024-06-27 50.WPF在.NET9中的重大更新：Windows 11 主题2024-07-01 51.ONNX Runtime入门示例：在C#中使用ResNet50v2进行图像识别2024-07-02 52.动手学Avalonia：基于SemanticKernel与硅基流动构建AI聊天与翻译工具2024-07-03 53.Avalonia应用在基于Linux的国产操作deepin上运行2024-07-04 54.如何让其他模型也能在SemanticKernel中调用本地函数2024-07-05 55.大语言模型的应用探索—AI Agent初探！2024-07-08 56.动手学Avalonia：基于硅基流动构建一个文生图应用（一）2024-07-10 57.WPF/C#：在WPF中如何实现依赖注入2024-07-11 58.ScreenToGif：一款开源免费且好用的录屏转Gif软件2024-07-12 59.WPF/C#：实现导航功能2024-07-18 60.关于学习.NET的历程回顾与今后的探索实践方向2024-07-24 61.入门Vue+.NET 8 Web Api记录（一）2024-07-25 62.SemanticKernel/C#：检索增强生成(RAG)简易实践2024-08-01 63.SemanticKernel/C#：使用Ollama中的对话模型与嵌入模型用于本地离线场景2024-08-02 64.SemanticKernel/C#：实现接口，接入本地嵌入模型2024-08-06 65.EF Core连接PostgreSQL数据库2024-08-07 66.基于SiliconCloud快速体验GraphRag.Net2024-08-08 67.AvaloniaChat：一个基于大语言模型用于翻译的简单应用2024-08-16 68.最佳实践：在AvaloniaChat中接入SiliconCloud2024-08-16 69.AvaloniaChat—从源码构建指南2024-08-18 70.SimpleRAG：基于WPF与Semantic Kernel实现的一个简单的RAG应用2024-08-19 71.Semantic Kernel/C#：接入智谱AI的两种方式2024-08-21 72.AvaloniaChat-v0.0.2：兼容智谱AI 快速使用指南2024-08-21 73.使用SiliconCloud快速体验SimpleRAG（手把手教程）2024-08-22 74.使用Ollama本地离线体验SimpleRAG（手把手教程）2024-08-23 75.Semantic Kernel/C#：一种通用的Function Calling方法，文末附经测试可用的大模型2024-08-29 76.在SimpleRAG中使用SiliconCloud快速测试Function Calling2024-08-29 77.SimpleTranslationAIAgent：基于C#与LLM的翻译AI Agent2024-08-31 78.SimpleTranslationAIAgent借助SiliconCloud API 构建自己的专属翻译助手2024-08-31 79.SimpleAISearch：C# + DuckDuckGo 实现简单的AI搜索2024-09-20 80.SimpleAIAgent：使用免费的glm-4-flash即可开始构建简单的AI Agent应用2024-09-25 81.SimpleRAG-v1.0.3：增加文件对话功能2024-09-26 82.如何自己动手实现一个图片解答小助手2024-10-09 83.AvaloniaTCP-v1.0.0：学习使用Avalonia/C#进行TCP通讯的一个简单Demo2024-10-14 84.Microsoft.Extensions.AI 初探2024-11-20 85.TesseractOCR-GUI：基于WPF/C#构建TesseractOCR简单易用的用户界面2024-12-07 86.VLM-OCR-Demo：一个使用VLM用于OCR任务的示例2024-12-09 87.C#调用Python脚本的方式（一），以PaddleOCR-GUI为例2024-12-13 88.C#调用Python代码的方式（二），以PaddleOCR-GUI为例2024-12-17 89.C#使用Tesseract C++ API过程记录2024-12-27 90.C#调用C++代码，以OpenCV为例2024-12-27 91.使用C#构建一个论文总结AI Agent01-02 92.PaperAssistant：使用Microsoft.Extensions.AI实现01-04 93.C# AIModelRouter：使用不同的AI模型完成不同的任务01-06

PaddlePaddle介绍✨

PaddlePaddle（飞桨）是百度开发的深度学习平台，旨在为开发者提供全面、灵活的工具集，用于构建、训练和部署各种深度学习模型。它具有开放源代码、高度灵活性、可扩展性和分布式训练等特点。PaddlePaddle支持端到端的部署，可以将模型轻松应用于服务器、移动设备和边缘设备。此外，PaddlePaddle拥有丰富的预训练模型库，涵盖图像分类、目标检测、语义分割等常见任务。社区支持和生态系统完善，为开发者提供了丰富的教程、文档和示例代码，助力深度学习模型的开发和应用。

PaddleOCR介绍✨

PaddleOCR是基于飞桨（PaddlePaddle）深度学习框架开发的开源光学字符识别（OCR）工具。它提供了端到端的OCR解决方案，支持文本检测、文本识别以及关键点检测等功能。PaddleOCR具有高度灵活性和可扩展性，可以适应多种场景下的文本识别需求，包括身份证识别、车牌识别、表格识别等。通过预训练的模型，PaddleOCR能够实现高精度的文本检测和识别，同时支持多语言文本识别，包括中文、英文等。此外，PaddleOCR还提供了丰富的API接口和模型库，方便开发者快速集成和部署OCR功能，助力各种应用场景下的文本识别任务。

PaddleSharp介绍✨

PaddleSharp是一个基于C#语言封装的飞桨（PaddlePaddle）深度学习框架的库。它为C#开发者提供了在熟悉的环境中利用飞桨强大功能的能力。PaddleSharp支持构建、训练和部署各种深度学习模型，包括图像分类、目标检测、语义分割等任务。该库提供了丰富的功能和工具，包括模型构建、预训练模型加载、高性能计算支持等。通过PaddleSharp，开发者可以利用飞桨底层计算库实现高性能的深度学习计算，有效地利用GPU或CPU资源。总体而言，PaddleSharp为C#开发者提供了一个便捷的工具，使他们能够在C#环境中轻松应用飞桨的深度学习功能。

Winform界面设计✨

Winform界面设计如下：

就两个按钮一个富文本框一个PictureBox。

步骤✨

安装对应的Nuget

进行图片文字识别

使用的代码也比较简单：

FullOcrModel model = LocalFullModels.ChineseV3;
         
using (PaddleOcrAll all = new PaddleOcrAll(model, PaddleDevice.Mkldnn())
{
    AllowRotateDetection = true, /* 允许识别有角度的文字 */
    Enable180Classification = false, /* 允许识别旋转角度大于90度的文字 */
})
{
    // Load local file by following code:
    using (Mat src2 = Cv2.ImRead(selectedPicture))             
    {
        PaddleOcrResult result = all.Run(src2);
        richTextBox1.Text = result.Text;
    }
}

FullOcrModel model = LocalFullModels.ChineseV3;

这行代码创建了一个FullOcrModel对象，该对象表示PaddleOCR的模型。LocalFullModels.ChineseV3是一个预训练的模型，专门用于识别中文字符。

using (PaddleOcrAll all = new PaddleOcrAll(model, PaddleDevice.Mkldnn())
{
    AllowRotateDetection = true, /* 允许识别有角度的文字 */
    Enable180Classification = false, /* 允许识别旋转角度大于90度的文字 */
})

这段代码创建了一个PaddleOcrAll对象，该对象用于运行OCR模型并获取识别结果。PaddleDevice.Mkldnn()表示使用Intel的MKL-DNN库来加速计算。
AllowRotateDetection = true表示允许识别有角度的文字，即使文字并不完全水平，也能被识别。
Enable180Classification = false表示不允许识别旋转角度大于90度的文字，如果文字旋转的角度过大，可能无法被正确识别。
using关键字用于确保PaddleOcrAll对象在不再需要时能被正确地释放，避免内存泄漏。

 using (Mat src2 = Cv2.ImRead(selectedPicture))

这行代码使用OpenCV的ImRead函数读取指定路径的图片文件，返回一个Mat对象，该对象是OpenCV用于表示图像的类。selectedPicture是图片文件的路径。using关键字确保Mat对象在不再需要时能被正确地释放，避免内存泄漏。

PaddleOcrResult result = all.Run(src2);

这行代码将读取的图片传递给PaddleOCR模型进行文字识别。all.Run(src2)会运行OCR模型并返回识别结果，结果被存储在PaddleOcrResult对象中。

PaddleOcrResult是一个record，属性有Regions与Text：

本示例的Regins如下所示：

本示例的Text如下所示：

本示例的效果如下图所示：

本示例全部代码：

using OpenCvSharp;
using Sdcb.PaddleInference;
using Sdcb.PaddleOCR.Models.Local;
using Sdcb.PaddleOCR.Models;
using Sdcb.PaddleOCR;
using System.Diagnostics;

namespace PaddleSharpDemo
{
    public partial class Form1 : Form
    {
        string selectedPicture;
        public Form1()
        {
            InitializeComponent();
        }
   
        private void button1_Click(object sender, EventArgs e)
        {
            OpenFileDialog openFileDialog = new OpenFileDialog();
            openFileDialog.Filter = "Image Files(*.BMP;*.JPG;*.GIF;*.PNG)|*.BMP;*.JPG;*.GIF;*.PNG|All files (*.*)|*.*";
            openFileDialog.FilterIndex = 1;
            openFileDialog.Multiselect = false;

            if (openFileDialog.ShowDialog() == DialogResult.OK)
            {
                selectedPicture = openFileDialog.FileName;
                MessageBox.Show($"您选中的图片路径为：{selectedPicture}");
                // 使用Image类加载图片
                Image image = Image.FromFile(selectedPicture);
                // 让PictureBox完全显示图片
                pictureBox1.SizeMode = PictureBoxSizeMode.Zoom;
                // 将图片显示在PictureBox中
                pictureBox1.Image = image;

            }
            else
            {
                MessageBox.Show("您本次没有选择任何图片！！！");
            }
        }

        private void button2_Click(object sender, EventArgs e)
        {
            FullOcrModel model = LocalFullModels.ChineseV3;
         
            using (PaddleOcrAll all = new PaddleOcrAll(model, PaddleDevice.Mkldnn())
            {
                AllowRotateDetection = true, /* 允许识别有角度的文字 */
                Enable180Classification = false, /* 允许识别旋转角度大于90度的文字 */
            })
            {
                // Load local file by following code:
                using (Mat src2 = Cv2.ImRead(selectedPicture))             
                {
                    PaddleOcrResult result = all.Run(src2);
                    richTextBox1.Text = result.Text;
                }
            }
        }
    }
}

PaddleOCR的命令行使用与Python脚本使用✨

我选择PaddleSharp的原因是想在C#中应用中直接使用，如果你不熟悉C#，可以选择在命令行或者Python脚本中使用PaddleOCR。

具体安装过程官网上有教程，其他人也出了很多教程，我这里就不重复说了，就简单演示一下命令行与Python脚本的使用。

命令行使用

命令：

paddleocr --image_dir ./封面.png --use_angle_cls true --use_gpu false

效果：

Python脚本使用

Python脚本如下所示：

from paddleocr import PaddleOCR, draw_ocr

# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory
img_path = 'D:\\桌面\\2024.04学习内容\\封面.png'
result = ocr.ocr(img_path, cls=True)
for idx in range(len(result)):
    res = result[idx]
    for line in res:
        print(line)

# 显示结果
from PIL import Image
result = result[0]
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='./fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')