Fork me on GitHub
摘要: 将内容上传至知识库后,要对内容进行分段与数据清洗。该阶段是内容的预处理与数据结构化过程,长文本将会被划分为多个内容分段。 1 分段 由于LLM的上下文窗口有限,无法一次性处理和传输整个知识库的内容,因此需对文档 中的长文本分段为内容块。即便部分大模型已支持上传完整的文档文件,但实验表明,检索效率依然 阅读全文
posted @ 2025-02-20 10:31 公众号-JavaEdge 阅读(671) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示