论文笔记 - 随笔分类 - 颀周

论文解读：EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

摘要：EasyEdit2——即插即用的LLM行为控制（Steering）框架： 1、支持广泛的测试时干预，包括安全性、情绪、个性、推理模式、事实性和语言特征。 2、关键模块：转向向量生成器和转向向量应用器。论文发表于EMNLP 2025 System Demonstrations，Arxiv链接：htt 阅读全文

posted @ 2026-01-01 09:49 颀周阅读(647) 评论(0) 推荐(0)

论文解读：One-shot Entropy Minimization

摘要：一篇还未发表的论文，但做了大量实验对熵最小化技巧提升模型推理能力进行了探索。本文训练了13440个大型语言模型，发现熵最小化（EM）只需要一个未标记的数据和10步优化，性能提升就比RL还强。基于两个直接而简单的假设：生成大型语言模型的采样过程本质上是随机的。正确答案的熵通常低于错误答案。 EM和阅读全文

posted @ 2025-12-31 15:36 颀周阅读(654) 评论(0) 推荐(1)

论文解读：ThinkEdit: Interpretable Weight Editing to Mitigate Overly Short Thinking in Reasoning Models

摘要：论文发表于NLP顶会EMNLP 2025（原文链接）。大模型CoT产生过短推理，即使简单数学问题也性能下降。本文研究推理长度如何嵌入推理模型的隐藏表示，以影响准确性： 1、发现，推理长度由表示空间中的线性方向决定，从而能沿着该方向引导模型，诱导过短推理。 2、引入权重编辑方法ThinkEdit，缓解阅读全文

posted @ 2025-12-18 11:27 颀周阅读(753) 评论(0) 推荐(0)

UniEdit：首个大型开放域大模型知识编辑基准

摘要：随着大语言模型（LLM）的广泛应用，它们在医疗、金融、教育等关键行业扮演着愈发重要的角色。然而，一个被忽视的现实是：大模型的知识并不会自动更新，更不总是准确。当模型输出过时信息、错误事实甚至自信满满的“胡说八道”时，如何快速、精准、低成本地纠正它？知识编辑（Model Editing）因此成为近年来阅读全文

posted @ 2025-12-15 16:43 颀周阅读(1003) 评论(0) 推荐(0)

论文笔记：AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models（AlphaEdit）

摘要：论文发表于人工智能顶会ICLR（原文链接）。基于定位和修改的模型编辑方法（针对ROME和MEMIT等）会破坏LLM中最初保存的知识，特别是在顺序编辑场景。为此，本文提出AlphaEdit： 1、在将保留知识应用于参数之前，将扰动投影到保留知识的零空间上。 2、从理论上证明，这种预测确保了在查询保留的阅读全文

posted @ 2025-07-10 17:33 颀周阅读(728) 评论(0) 推荐(1)

论文解读：MASS-EDITING MEMORY IN A TRANSFORMER（MEMIT）

摘要：论文发表于人工智能顶会ICLR（原文链接）。在模型编辑方法中，过去工作主要局限于更新单个事实。因此，基于ROME，本文开发了MEMIT，在大模型GPT-J（6B）和GPT-NeoX（20B）上实现了数千的批量编辑。阅读本文请同时参考原始论文图表。方法模型定义为文中式(1)，其中$[x_{[1] 阅读全文

posted @ 2025-07-09 10:26 颀周阅读(334) 评论(0) 推荐(2)

Benchmark论文解读：Evaluating the Ripple Effects of Knowledge Editing in Language Models

摘要：论文发表于自然语言处理顶刊TACL-2024（原文链接）。目前模型编辑方法的评估主要集中在测试单个事实是否被成功注入，以及模型对其它事实的预测是否没有改变。作者认为这样的评估模式有限，因为注入一个事实会产生涟漪效应，模型应该同步更新一系列的额外事实。比如当注入：z是e的母亲时。模型应该同步更新：z的阅读全文

posted @ 2025-06-11 01:25 颀周阅读(242) 评论(0) 推荐(0)

论文解读：Knowledge Neurons in Pretrained Transformers

摘要：论文发表于自然语言处理顶会ACL-2022（原文链接）。本文引入知识神经元 (Knowledge Neuron) 的概念，初步研究了预训练Transformer中是如何存储事实知识的： 1、通过研究预训练的BERT，本文发现预训练语言模型的知识是独立存在于中间神经元激活中的 2、可以通过编辑FFN层阅读全文

posted @ 2025-06-08 13:47 颀周阅读(248) 评论(0) 推荐(0)

论文解读：Fast Model Editing at Scale (MEND)

摘要：论文发表于人工智能顶会ICLR（原文链接）。为了实现大规模编辑，提出基于梯度分解的模型编辑网络（Model Editor Networks with Gradient Decomposition, MEND）：训练一个小型辅助编辑网络的集合，对通过微调获得的梯度的低阶分解进行变换，使用变换后的梯度更阅读全文

posted @ 2025-06-07 12:51 颀周阅读(271) 评论(0) 推荐(0)

综述论文解读：Editing Large Language Models: Problems, Methods, and Opportunities

摘要：论文为大语言模型知识编辑综述，发表于自然语言处理顶会ACL（原文链接）。由于目前存在广泛的模型编辑技术，但一个统一全面的分析评估方法，所以本文： 1、对LLM的编辑方法进行了详尽、公平的实证分析，探讨了它们各自的优势和劣势。 2、构建了一个新的数据集，旨在揭示当前模型编辑方法的缺点，特别是泛化和效率阅读全文

posted @ 2025-06-07 12:35 颀周阅读(346) 评论(0) 推荐(0)

论文解读：Aging with GRACE: Lifelong Model Editing with Discrete Key-Value Adapters

摘要：论文发表于人工智能顶会NeurIPS（原文链接）。当前的模型编辑器会因多次编辑损害模型性能，提出用于连续编辑的通用检索适配器(General Retrieval Adapters for Continual Editing, GRACE)：使用一个类似字典的结构（适配器）为需要修改的潜在表示构建新的阅读全文

posted @ 2025-06-06 12:59 颀周阅读(217) 评论(0) 推荐(0)

论文解读：Locating and Editing Factual Associations in GPT（ROME）

摘要：论文发表于人工智能顶会NeurIPS（原文链接），研究了GPT（Generative Pre-trained Transformer）中事实关联的存储和回忆，发现这些关联与局部化、可直接编辑的计算相对应。因此： 1、开发了一种因果干预方法，用于识别对模型的事实预测起决定性作用的神经元。 2、为了验证阅读全文

posted @ 2025-06-05 20:11 颀周阅读(374) 评论(0) 推荐(0)

深度变分信息瓶颈——Deep Variational Information Bottleneck

摘要：Deep Variational Information Bottleneck (VIB) 变分信息瓶颈论文阅读笔记。本文利用变分推断将信息瓶颈框架适应到深度学习模型中，可视为一种正则化方法。变分信息瓶颈假设数据输入输出对为$(X,Y)$，假设判别模型$f_\theta(\cdot)$有关于$ 阅读全文

posted @ 2024-11-28 17:22 颀周阅读(1263) 评论(0) 推荐(2)

孤立森林（IForest）代码实现及与PyOD对比

摘要：

孤立森林（Isolation Forest）是经典的异常检测算法（论文网址）。本文用python对其进行实现，以及与常用的异常检测包PyOD进行效果对比。简单来说，孤立森林（IForest）中包含若干孤立树（ITree），每颗树的创建是独立的，与其它树无关。假设数据集包含$n$个样本，每个样本都包阅读全文

posted @ 2023-03-22 13:23 颀周阅读(1165) 评论(0) 推荐(0)

TIE: A Framework for Embedding-based Incremental Temporal Knowledge Graph Completion 增量时序知识图谱补全论文解读

摘要：论文网址：https://dl.acm.org/doi/10.1145/3404835.3462961 Arxiv：https://arxiv.org/abs/2104.08419 论文提出一种用增量学习思想做时序知识图谱补全（Temporal Knowledge Graph Completion, 阅读全文

posted @ 2022-12-13 16:45 颀周阅读(713) 评论(0) 推荐(0)

Relational Learning with Gated and Attentive Neighbor Aggregator for Few-Shot Knowledge Graph Completion 小样本知识图谱补全论文解读

摘要：小样本知识图补全——关系学习。论文利用三元组的邻域信息，提升模型的关系表示学习，来实现小样本的链接预测。主要应用的思想和模型包括：GAT（图注意力神经网络）、TransH、SLTM、Model-Agnostic Meta-Learning (MAML)。论文地址：https://arxiv.org 阅读全文

posted @ 2022-12-09 15:02 颀周阅读(448) 评论(0) 推荐(1)

Model-Agnostic Meta-Learning (MAML) 理解

摘要：模型不可知元学习（Model-Agnostic Meta-Learning, MAML）的目标是使模型每次的梯度更新更有效、提升模型的学习效率、泛化能力等，它可以被看做一种对模型进行预训练的方法，适用于小样本学习。原文：http://proceedings.mlr.press/v70/finn17 阅读全文

posted @ 2022-12-08 16:28 颀周阅读(1080) 评论(0) 推荐(0)

Image Super-Resolution via Sparse Representation——基于稀疏表示的超分辨率重建

摘要：经典超分辨率重建论文，基于稀疏表示。下面首先介绍稀疏表示，然后介绍论文的基本思想和算法优化过程，最后使用python进行实验。稀疏表示稀疏表示是指，使用过完备字典中少量向量的线性组合来表示某个元素。过完备字典是一个列数大于行数的行满秩矩阵，也就是说，它的列向量有无数种线性组合来表达列向量空间中的阅读全文

posted @ 2021-03-04 21:32 颀周阅读(3024) 评论(15) 推荐(3)

Auto-Encoding Variational Bayes (VAE原文)、变分推理

摘要：变分自动编码器的大致概念已经理解了快一年多了，但是其中的数学原理还是没有搞懂，在看到相关的变体时，总会被数学公式卡住。下决心搞懂后，在此记录下我的理解。公式推导——变分下界这篇文章提出一种拟合数据集分布的方法，拟合分布最常见的应用就是生成模型。该方法遵循极大似然策略，即对于数据集$X = \{x 阅读全文

posted @ 2021-02-15 22:58 颀周阅读(2456) 评论(0) 推荐(6)

GAN训练技巧汇总

摘要：GAN自推出以来就以训练困难著称，因为它的训练过程并不是寻找损失函数的最小值，而是寻找生成器和判别器之间的纳什均衡。前者可以直接通过梯度下降来完成，而后者除此之外，还需要其它的训练技巧。下面对历年关于GAN的论文提出的训练技巧进行总结，这里仅记录技巧，具体原理请直接看论文原文。 WGAN和WGAN 阅读全文

posted @ 2020-10-05 21:47 颀周阅读(2076) 评论(0) 推荐(3)

LOADING . . .

qizhou

随笔分类 - 论文笔记

公告