摘要:
引言 场景文本检测任务,一直以来是OCR整个任务中最为重要的一环。虽然有一些相关工作是端对端OCR工作的,但是从工业界来看,相关落地应用较为困难。因此,两阶段的OCR方案一直是优先考虑的。 在两阶段中(文本检测+文本识别),文本检测是极为重要的一环。自从DBNet提出后,工业界似乎找到了法宝,DBN 阅读全文
摘要:
引言 随着LaTeX-OCR模型转换问题的解决,公式识别任务中各个链条已经全部打通。小伙伴们可以放开膀子干了。 解决业界问题的方案,并不是单独训练一个模型就完事了,而是有着上下游的依赖。这就像工厂中流水线作业一样,一个小东西的生产是依赖无数个中间阶段才完成的。 一个模型应用到产品中,也是有着类似的流 阅读全文
摘要:
引言 TableStructureRec 仓库是用来对文档中表格做结构化识别的推理库,包括来自 PaddleOCR 的表格结构识别算法模型、来自阿里读光有线和无线表格识别算法模型等。 该仓库将表格识别前后处理做了完善,并结合 OCR,保证表格识别部分可直接使用。 该仓库会持续关注表格识别这一领域,集 阅读全文
摘要:
@目录引言方案一:基于LaTeX环境方案二:基于KaTeX(推荐) 方案三:基于Matplotlib写在最后 引言 近来,涉及到一些公式识别的项目,输入是公式的图像,输出是LaTeX格式的数学公式字符串。 这类项目一般都采用深度学习的方法来做,这就涉及到构造公式LaTeX字符串和对应渲染后图像的数据 阅读全文
摘要:
简介 rapidocr_paddle系列包是基于PaddlePaddle框架作为推理引擎的,支持CPU和GPU上推理。值得说明的是,这个包和PaddleOCR相比,代码基本都是一样的,只不过这个库将里面核心推理代码抽了出来,更加精简而已。 推荐GPU上用这个,CPU端还是以rapidocr_onnx 阅读全文
摘要:
引言 随着开源项目的越来越复杂,项目文档的重要性日渐突出。一个好的项目要有一个清晰明了的文档来帮助大家使用。 最近一直有在找寻一个简洁明了的文档主题来放置项目的各种相关文档。最终找到这次的主角:Lotus Docs 基于Hugo的主题。Lotus Docs的样子,可以移步这里查看。 下面着重讲解如何 阅读全文
摘要:
## ⚠️注意:后续更新,请移步[README](https://github.com/RapidAI/Knowledge-QA-LLM) ## Knowledge QA LLM =3.8, - 基于本地知识库+LLM的问答系统。该项目的思路是由[langchain-ChatGLM](https:/ 阅读全文
摘要:
## [Text Detect Metric](https://github.com/SWHL/TextDetMetric) =3.6, - 该库用于计算`Precision`、`Recall`和`H-mean`三个指标,用来评测文本检测算法效果。与[魔搭-文本检测测试集](https://www. 阅读全文
摘要:
### 引言 - 日常中,写的最多的代码是Python,虽说是算法工程师,这不也是工程师嘛,所以基本的代码功底还是要有的。 - 由于Python是动态类型语言,没有强制的约束,如果没有一些相应规范,会导致大家写的代码可读性较差,且潜在的问题难以发现。 - 因此,本文旨在引入一些工具来帮助大家写出更加 阅读全文
摘要:
## [Rapid Latex OCR](https://github.com/RapidAI/RapidLatexOCR) =3.6, * `rapid_latex_ocr`是一个将公式图像转为latex格式的工具。 * **仓库中的推理代码来自修改自[LaTeX-OCR](https://git 阅读全文