需求：表格识别转为 markdown ，已废弃

~~需求：我有一些pad 文件，它们有一些表格。我需要一个图像识别工具，或者是根据我复制的表格文本来自动生成 markdown 代码。~~

~~两种方案：~~

~~一种是基于图像，输入图像然后分割每一个元素，送到 OCR 中进行文字识别，最后进行 OCR 的格式转换，再组装成 markdown 格式。~~

~~第二种：写一个复制文本就可以生成 markdown 的python 代码。~~

~~两者都需要 GUI 界面。我会实现第二种以满足我的要求。~~

~~这里的主要问题在于切分元素，不过这方面其实也有很多表格识别的研究。有时间看看。~~

已经废除，因为我找到了识别文档的更好的工具 doc2x

posted @ 2023-02-17 16:12 Zenith_Hugh 阅读(50) 评论(0) 收藏举报

刷新页面返回顶部

Zenith Hugh