zjz2333

2023年12月2日

摘要： NaLLM 项目总结前后端分离，前端Vue3，后端Fastapi 项目的整体界面如图：主要实现三种功能： Unstructured Import：实现非结构化文本的知识图谱提取和实体关系、去重等操作，最终返回提取的实体、关系和对应的属性，本项目也提供了将原始提取结果转换为CSV文件的类，便于结果阅读全文

posted @ 2023-12-02 13:00 zjz2333 阅读(755) 评论(0) 推荐(0) 编辑

2023年11月19日

Neo4j基础学习

摘要：还是参考微信公众号的一篇文章 “关于图数据库（Neo4j）你应该知道的一切” 先简单介绍一下，Neo4j相关的服务 Neo4j 数据库，又名为Noe4j DBMS 同时还有Neo4j AuraDB，是一种完全托管的云服务。比较重要的还有Cypher，是neo4j的查询语言采用neo4j数据库主要阅读全文

posted @ 2023-11-19 16:59 zjz2333 阅读(73) 评论(0) 推荐(0) 编辑

2023年11月12日

Neo4j+Langchain实现非结构化知识图谱增强QA

摘要：微信公众号的一篇文章，着重介绍如何使用知识图谱来增强大语言模型QA的问答效果 1. 核心架构核心架构如下：可以通过Neo4j的向量索引和Neoconj图数据的强大能力来实现检索增强的生成系统，提供精确且上下文丰富的答案。两条路：向量相似性搜索来检索非结构化信息，访问图数据库来提取结构化信息阅读全文

posted @ 2023-11-12 19:49 zjz2333 阅读(4326) 评论(0) 推荐(0) 编辑

2023年11月2日

论文阅读：InstructIE： A Chinese Instruction-based Information Extraction Dataset

摘要：主要提出了一种数据集Instruction-based IE，要求模型根据指令来提取信息。 1. Instruction 为IE任务创建特定的数据集式消耗事时间与资源的。面对这些挑战的常见方法： Seq2seq提出 TANL将其视为自然语言增强的翻译任务。 UIE提出一种text-to-struc 阅读全文

posted @ 2023-11-02 22:03 zjz2333 阅读(206) 评论(0) 推荐(0) 编辑

2023年10月25日

论文阅读：DeepKE：A Deep Learning Based Knowledge Extraction Toolkit for Knowledge Base Population

摘要： DeepKE，支持数据集和模型的结合来实现非结构化数据中信息的提取。同时提出框架和一系列的组件来实现足够的模块化和可扩展性。项目地址先根据paper做一个介绍 1. Introduction 现存的KB是在实体和关系方面是不完备的。常见的一些标志性的应用： Spacy（实体识别） OpenN 阅读全文

posted @ 2023-10-25 22:34 zjz2333 阅读(271) 评论(0) 推荐(0) 编辑

2023年10月22日

论文阅读：Unifying Large Language Model and Knowledge Graph：A RoadMap

摘要： 1 Introduction 大模型和知识图谱结合的综述。简单介绍一下大模型和知识图谱的优缺点：如上所示。本文主要划分为三个模块，分别为： KG-enhanced LLMs LLM-augmented KGs Synergized LLM + KG 2 Background 主要介绍了LLM和阅读全文

posted @ 2023-10-22 11:05 zjz2333 阅读(231) 评论(0) 推荐(0) 编辑

2023年10月8日

论文阅读：A Lightweight Knowledge Graph Embedding Framework for Efficient Inference and Storage

摘要： ABSTRACT 现存的KGE方法无法适用于大规模的图（由于存储和推理效率的限制）作者提出了一种LightKG框架：自动的推断出码本codebooks和码字codewords，为每个实体生成合适的embedding。同时，框架中包含残差模块来实现码本的多样性，并且包含连续函数来近似的实现码字的阅读全文

posted @ 2023-10-08 11:04 zjz2333 阅读(62) 评论(0) 推荐(0) 编辑

2023年10月5日

论文阅读：iterator zero-shot llm prompting for knowledge graph construction

摘要： Abstract 知识图谱，一种相互连接和可解释的结构。生成需要更多的人力、领域知识、并需要适用于不同的应用领域。本论文提出借助LLM，通过0-shot和外部知识不可知的情况下生成知识图谱。主要贡献：迭代的prompting提取最终图的相关部分 0-shot，不需要examples 一个可扩阅读全文

posted @ 2023-10-05 19:54 zjz2333 阅读(104) 评论(0) 推荐(0) 编辑

2023年9月15日

论文阅读： Co-design Hardware and Algorithm for Vector Search

摘要： 1. Introduction 介绍一下论文背景，向量检索常用于搜索引擎，推荐系统，LLM和科学计算等对应的常用的硬件向量检索方法，IVF-PQ 其中IVF：将多个向量聚类, PQ将向量压缩而为了最大化IVF-PQ的效果，也会面临很多的挑战在芯片设计的过程中，会遇到针对六个阶段如何设计合适阅读全文

posted @ 2023-09-15 21:10 zjz2333 阅读(142) 评论(0) 推荐(0) 编辑

2023年9月12日

ANN（大规模向量检索方法）

摘要：向量检索这篇文章主要介绍一些向量检索的常用方法向量检索主要分为两种情况，分别为NN和ANN 首先是最近邻NN，时间复杂度为\(O(ND)\) 其中N为向量的个数，D为向量的维度，运算速度较慢 ANN通过牺牲一部分的内存和内存占用等，换来更快的检索速度（不一定是最近似的，比较近似的即可） NN和A 阅读全文

posted @ 2023-09-12 23:02 zjz2333 阅读(673) 评论(4) 推荐(0) 编辑

zjz2333

阅读思考实践总结

公告

zjz2333

阅读 思考 实践 总结

公告

阅读思考实践总结