摘要: 在朴素RAG中通常会对文档、文本进行分块后进行文档嵌入,对所有文件、文本都没有经过采用Chunk方法可能有时候效果不是和好,尽管有着各种分块策略有针对大文件的、针对小文件的策略,但都难免可能会造成上下文语义丢失。 分块通常有两个非常重要的参数chunk_size、chunk_overlap,分别代表 阅读全文
posted @ 2024-07-08 08:42 AiFly 阅读(143) 评论(0) 推荐(0) 编辑