摘要:
NaLLM 项目总结 前后端分离,前端Vue3,后端Fastapi 项目的整体界面如图: 主要实现三种功能: Unstructured Import:实现非结构化文本的知识图谱提取和实体关系、去重等操作,最终返回提取的实体、关系和对应的属性,本项目也提供了将原始提取结果转换为CSV文件的类,便于结果 阅读全文
摘要:
还是参考微信公众号的一篇文章 “关于图数据库(Neo4j)你应该知道的一切” 先简单介绍一下,Neo4j相关的服务 Neo4j 数据库,又名为Noe4j DBMS 同时还有Neo4j AuraDB,是一种完全托管的云服务。 比较重要的还有Cypher,是neo4j的查询语言 采用neo4j数据库主要 阅读全文
摘要:
微信公众号的一篇文章,着重介绍如何使用知识图谱来增强大语言模型QA的问答效果 1. 核心架构 核心架构如下: 可以通过Neo4j的向量索引和Neoconj图数据的强大能力来实现检索增强的生成系统,提供精确且上下文丰富的答案。 两条路: 向量相似性搜索来检索非结构化信息, 访问图数据库来提取结构化信息 阅读全文
摘要:
主要提出了一种数据集Instruction-based IE,要求模型根据指令来提取信息。 1. Instruction 为IE任务创建特定的数据集式消耗事时间与资源的。 面对这些挑战的常见方法: Seq2seq提出 TANL将其视为自然语言增强的翻译任务。 UIE提出一种text-to-struc 阅读全文
摘要:
DeepKE,支持数据集和模型的结合来实现非结构化数据中信息的提取。 同时提出框架和一系列的组件来实现足够的模块化和可扩展性。 项目地址 先根据paper做一个介绍 1. Introduction 现存的KB是在实体和关系方面是不完备的。 常见的一些标志性的应用: Spacy(实体识别) OpenN 阅读全文
摘要:
1 Introduction 大模型和知识图谱结合的综述。 简单介绍一下大模型和知识图谱的优缺点: 如上所示。 本文主要划分为三个模块,分别为: KG-enhanced LLMs LLM-augmented KGs Synergized LLM + KG 2 Background 主要介绍了LLM和 阅读全文
摘要:
ABSTRACT 现存的KGE方法无法适用于大规模的图(由于存储和推理效率的限制) 作者提出了一种LightKG框架: 自动的推断出码本codebooks和码字codewords,为每个实体生成合适的embedding。 同时,框架中包含残差模块来实现码本的多样性,并且包含连续函数来近似的实现码字的 阅读全文
摘要:
Abstract 知识图谱,一种相互连接和可解释的结构。 生成需要更多的人力、领域知识、并需要适用于不同的应用领域。 本论文提出借助LLM,通过0-shot和外部知识不可知的情况下生成知识图谱。 主要贡献: 迭代的prompting提取最终图的相关部分 0-shot,不需要examples 一个可扩 阅读全文
摘要:
1. Introduction 介绍一下论文背景, 向量检索常用于 搜索引擎,推荐系统,LLM和科学计算等 对应的常用的硬件向量检索方法,IVF-PQ 其中IVF:将多个向量聚类, PQ将向量压缩 而为了最大化IVF-PQ的效果,也会面临很多的挑战 在芯片设计的过程中,会遇到针对六个阶段如何设计合适 阅读全文
摘要:
向量检索 这篇文章主要介绍一些向量检索的常用方法 向量检索主要分为两种情况,分别为NN和ANN 首先是最近邻NN,时间复杂度为\(O(ND)\) 其中N为向量的个数,D为向量的维度,运算速度较慢 ANN通过牺牲一部分的内存和内存占用等,换来更快的检索速度(不一定是最近似的,比较近似的即可) NN和A 阅读全文