Fork me on GitHub
摘要: 1 开源解析和拆分文档 第三方的工具去对文件解析拆分,去将我们的文件内容给提取出来,并将我们的文档内容去拆分成一个小的chunk。常见的PDF word mark down, JSON、HTML。都可以有很好的一些模块去把这些文件去进行一个东西去提取。 优势 支持丰富的文档类型 每种文档多样化选择 阅读全文
posted @ 2024-04-11 22:12 公众号-JavaEdge 阅读(175) 评论(0) 推荐(0) 编辑