非结构化文档解析

参考:RAG效果优化:高质量文档解析详解

知识库

RAG的核心之一就是知识库的离线存储,如何将非结构化文档存储是非常重要的。
image

PDF和Word文件结构

image
image
image
image

word文件解析

image

pdf文件解析

image

Papermage介绍

image
image
image

总结

image

阿里云上的文件解析方法

image

示例

image
image
image

准确率

image

参考

image

posted @   PamShao  阅读(81)  评论(0编辑  收藏  举报
努力加载评论中...
点击右上角即可分享
微信分享提示