随笔 - 317, 文章 - 0, 评论 - 453, 阅读 - 114万
  博客园  :: 首页  :: 新随笔  :: 订阅 订阅  :: 管理

C# 使用Tesseract实现OCR

Posted on   PHP-张工  阅读(215)  评论(0编辑  收藏  举报

使用Nuget安装Tesseract  
地址:https://www.nuget.org/packages/Tesseract
访问:https://github.com/tesseract-ocr/tessdata/blob/main/eng.traineddata
下载语言包,将语言包放在程序生成目录下的 \tessdata\eng.traineddata

OCR识别代码如下:

复制代码
public static string ImageToText(string imgPath)
{
    using (var engine = new TesseractEngine("tessdata", "eng", EngineMode.Default))
    {
        // 识别白名单设置
        // engine.SetVariable("tessedit_char_whitelist", "0123456789.-/");
        using (var img = Pix.LoadFromFile(imgPath))
        {
            using (var page = engine.Process(img))
            {
                return page.GetText();
            }
        }
    }
}
复制代码

 

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
点击右上角即可分享
微信分享提示