摘要:
引言 表格结构识别功能是智能文档中很重要的一个模块,又加之表格种类繁多,且复杂,又进一步让表格识别任务变得更加困难。 现阶段,开源的表格识别模型众多,但却难以有一个公平的对比,来方便我们在日常使用时选择合适的模型。因此,我们就以此为出发点,旨在解决评估开源表格模型评估问题,通过构建第三方评测集、发布 阅读全文
摘要:
引言 前一段时间,参与了PaddleOCR开源项目的文档站点搭建工作,基于mkdocs工具,采用mkdocs-material主题,基于Github Pages来搭建整个文档站点。目前该站点已经搭建完毕, 支持多语言、文档搜索等诸多功能。 最近得知,PaddleOCR文档站点需要支持多版本文档功能。 阅读全文
摘要:
引言 继上一篇文章之后,我这里想着将360发布的版面分析模型整合到现有的rapid_layout仓库中,便于大家快速使用。 不曾想到,我这整理工作越做越多了,好在整体都是往更好方向走。 起初,rapid_layout项目是在RapidStructure仓库下的。RapidStructure仓库包含三 阅读全文
摘要:
引言 今天中午,排队打饭间隙,刷到新闻,说是:360AILAB-NLP团队开源了中文论文、研报文档场景的轻量化版式分析模型360LayoutAnalysis。 面向中文论文及研报两个场景的轻量化版式分析模型已经开源: Github地址:https://github.com/360AILAB-NLP/ 阅读全文
摘要:
序言 之所以想着翻译这篇文章,是因为我看到国内不管是开源爱好者,还是开发者都不怎么了解 Github Discussions,以致于在 Github 仓库中提问时,总是忘记使用这个好东西,或者问错地方。 翻译自:What is GitHub Discussions? A complete guide 阅读全文
摘要:
引言 目前,开源的项目中有很多 OCR 模型,但是没有一个统一的基准来衡量哪个是更好一些的。 面对这么多的模型,让我们有些不知所措。为此,最近一段时间以来,我一直想要构建这样一个基准,现在来看,已经初步具有雏形。 为了能更好地评测各个模型效果,收集标注了两个开源评测集: text_det_test_ 阅读全文
摘要:
LabelConvert LabelConvert是一个目标检测和图像分割的数据集格式转换工具,支持labelme、labelImg与YOLO、VOC和COCO 数据集格式之间的相互转换。 支持的转换格式 安装 pip install label_convert 具体使用方法 由于文章篇幅所限,请移 阅读全文
摘要:
引言 此刻,今年将要毕业的无数莘莘学子正在奋笔疾书写着自己的毕业论文,淹没于繁琐的论文排版格式中。 小编也是从这个时候走过来的,深知其中不易之处。 好在现在有overleaf平台,可以稍稍缓解我们的痛点。但是经过一些调研发现,仍然存在两大痛点: 痛点1:没有对应的LaTeX模板 痛点2:overle 阅读全文
摘要:
⚠️注意: 后续更新移步CSDN: link 引言 通用文档理解,是OCR任务的终极目标。现阶段的OCR各种垂类任务都是通用文档理解任务的子集。这感觉就像我们一下子做不到通用文档理解,退而求其次,先做各种垂类任务。 现阶段,Transformer技术的发展,让通用文档理解任务变得不再是那么遥不可及, 阅读全文
摘要:
引言 总有小伙伴问到阿里的无线表格识别模型是如何转换为ONNX格式的。这个说来有些惭愧,现有的ONNX模型是很久之前转换的了,转换环境已经丢失,且没有做任何笔记。 今天下定决心再次尝试转换,庆幸的是转换成功了。于是有了转换笔记:ConvertLOREToONNX。 这次吸取教训,环境文件采用Anac 阅读全文