zjz2333

2025年7月15日

摘要： Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models 摘要：在当前LLM训练数据不透明，模型黑盒，合成数据增加，作者提出CDD（Contamin 阅读全文

posted @ 2025-07-15 15:22 zjz2333 阅读(48) 评论(0) 推荐(0)

2023年12月2日

NaLLM 项目总结

摘要： NaLLM 项目总结前后端分离，前端Vue3，后端Fastapi 项目的整体界面如图：主要实现三种功能： Unstructured Import：实现非结构化文本的知识图谱提取和实体关系、去重等操作，最终返回提取的实体、关系和对应的属性，本项目也提供了将原始提取结果转换为CSV文件的类，便于结果阅读全文

posted @ 2023-12-02 13:00 zjz2333 阅读(1001) 评论(0) 推荐(0)

2023年11月19日

Neo4j基础学习

摘要：还是参考微信公众号的一篇文章 “关于图数据库（Neo4j）你应该知道的一切” 先简单介绍一下，Neo4j相关的服务 Neo4j 数据库，又名为Noe4j DBMS 同时还有Neo4j AuraDB，是一种完全托管的云服务。比较重要的还有Cypher，是neo4j的查询语言采用neo4j数据库主要阅读全文

posted @ 2023-11-19 16:59 zjz2333 阅读(151) 评论(0) 推荐(0)

2023年11月12日

Neo4j+Langchain实现非结构化知识图谱增强QA

摘要：微信公众号的一篇文章，着重介绍如何使用知识图谱来增强大语言模型QA的问答效果 1. 核心架构核心架构如下：可以通过Neo4j的向量索引和Neoconj图数据的强大能力来实现检索增强的生成系统，提供精确且上下文丰富的答案。两条路：向量相似性搜索来检索非结构化信息，访问图数据库来提取结构化信息阅读全文

posted @ 2023-11-12 19:49 zjz2333 阅读(5554) 评论(0) 推荐(0)

2023年11月2日

论文阅读：InstructIE： A Chinese Instruction-based Information Extraction Dataset

摘要：主要提出了一种数据集Instruction-based IE，要求模型根据指令来提取信息。 1. Instruction 为IE任务创建特定的数据集式消耗事时间与资源的。面对这些挑战的常见方法： Seq2seq提出 TANL将其视为自然语言增强的翻译任务。 UIE提出一种text-to-struc 阅读全文

posted @ 2023-11-02 22:03 zjz2333 阅读(442) 评论(0) 推荐(0)

2023年10月25日

论文阅读：DeepKE：A Deep Learning Based Knowledge Extraction Toolkit for Knowledge Base Population

摘要： DeepKE，支持数据集和模型的结合来实现非结构化数据中信息的提取。同时提出框架和一系列的组件来实现足够的模块化和可扩展性。项目地址先根据paper做一个介绍 1. Introduction 现存的KB是在实体和关系方面是不完备的。常见的一些标志性的应用： Spacy（实体识别） OpenN 阅读全文

posted @ 2023-10-25 22:34 zjz2333 阅读(707) 评论(0) 推荐(0)

2023年10月22日

论文阅读：Unifying Large Language Model and Knowledge Graph：A RoadMap

摘要： 1 Introduction 大模型和知识图谱结合的综述。简单介绍一下大模型和知识图谱的优缺点：如上所示。本文主要划分为三个模块，分别为： KG-enhanced LLMs LLM-augmented KGs Synergized LLM + KG 2 Background 主要介绍了LLM和阅读全文

posted @ 2023-10-22 11:05 zjz2333 阅读(429) 评论(0) 推荐(0)

2023年10月8日

论文阅读：A Lightweight Knowledge Graph Embedding Framework for Efficient Inference and Storage

摘要： ABSTRACT 现存的KGE方法无法适用于大规模的图（由于存储和推理效率的限制）作者提出了一种LightKG框架：自动的推断出码本codebooks和码字codewords，为每个实体生成合适的embedding。同时，框架中包含残差模块来实现码本的多样性，并且包含连续函数来近似的实现码字的阅读全文

posted @ 2023-10-08 11:04 zjz2333 阅读(183) 评论(0) 推荐(0)

2023年10月5日

论文阅读：iterator zero-shot llm prompting for knowledge graph construction

摘要： Abstract 知识图谱，一种相互连接和可解释的结构。生成需要更多的人力、领域知识、并需要适用于不同的应用领域。本论文提出借助LLM，通过0-shot和外部知识不可知的情况下生成知识图谱。主要贡献：迭代的prompting提取最终图的相关部分 0-shot，不需要examples 一个可扩阅读全文

posted @ 2023-10-05 19:54 zjz2333 阅读(404) 评论(0) 推荐(0)

2023年9月15日

论文阅读： Co-design Hardware and Algorithm for Vector Search

摘要： 1. Introduction 介绍一下论文背景，向量检索常用于搜索引擎，推荐系统，LLM和科学计算等对应的常用的硬件向量检索方法，IVF-PQ 其中IVF：将多个向量聚类, PQ将向量压缩而为了最大化IVF-PQ的效果，也会面临很多的挑战在芯片设计的过程中，会遇到针对六个阶段如何设计合适阅读全文

posted @ 2023-09-15 21:10 zjz2333 阅读(334) 评论(0) 推荐(0)

zjz2333

阅读思考实践总结

公告

zjz2333

阅读 思考 实践 总结

公告

阅读思考实践总结