结构化数据的RAG库和大模型心得
结构化数据有很多列, 那么我们每一个列, 也就是pandas里面一个series. 设置一个向量库.这样一共是columns_number个向量库 来一个查询. 我们跟. 这么多个向量库每个进行比较. 然后就有了多重排序. 多路召回. max, min啥的逻辑就可用.
综合评分我用exp之后sum
自然语言来问, 那么我们就设置一些函数来支持查询.
第一次大模型来选择那些函数tool.
第二次大模型根据第一次选的函数tool. 从自然语言问题中提取选中函数应该使用的参数.这样大模型抽取就精确多了.容错率高了.