摘要: 文档理解是文档处理和提取中最重要的步骤。这是从非结构化或半结构化文档中提取信息并将其转换为结构化形式的过程。提取后的结构化表示可以支持各种下游任务,例如信息检索,汇总,分类等。有许多不同的方法可以理解文档,但它们都有一个共同的目标:创建文档内容的结构化表示,以便用于进一步的处理。 对于半结构化文档, 阅读全文
posted @ 2022-07-24 11:21 deephub 阅读(680) 评论(0) 推荐(0) 编辑