摘要:
1. 概述 基于给定的Prompt,大语言模型生成的Reponse可能不是最好的(这一点我认为当前的LLM大部分都是Decoder架构,基于已生成的结果产生下一个Token,一旦之前生成结果出错,也不容易及时改正。)。 本文为原始的生成添加了额外的反思重写步骤,过程如下: 对于给定的\(Input\ 阅读全文
摘要:
1. 概述 LLM的SFT数据合成工作不可避免的可以划分为多个阶段: 指令合成 响应合成 数据筛选。 本篇文章采用了传统LLM的训练过程(SFT+DPO)进行数据合成。 在领域专有模型(DeepSeekMath7B-RL,Qwen2-Math-7BInstruct)的基础上, 指令合成:通过QFT( 阅读全文
摘要:
redis可以通过SLAVEOF命令去复制(同步)另一台服务器,例如: 当前有两台redis服务器其信息为: hostname ip port redis_1 127.0.0.1 6379 redis_2 127.0.0.1 12345 如果redis_2想要同步redis_1的内容,可以在redi 阅读全文
摘要:
Raft Leader Election 背景介绍 Raft是一种用于管理Log的分布式一致性算法,在了解Raft之前首先需要了解为什么需要Log? 对于不同的系统,无论是中间件疑惑是其余的系统,我们如果想要求其满足CAP协议中的一致性,需要尽量保证多节点的数据是相同的,也就是所谓的“共识”。下文中 阅读全文
摘要:
提要:本系列文章主要参考`MIT 6.828课程`以及两本书籍`《深入理解Linux内核》` `《深入Linux内核架构》`对Linux内核内容进行总结。 内存管理的实现覆盖了多个领域: 1. 内存中的物理内存页的管理 2. 分配大块内存的伙伴系统 3. 分配较小内存的slab、slub、slob分 阅读全文
摘要:
二分法是搜索算法中极其典型的方法,其要求输入序列有序并可随机访问。算法思想为 输入:有序数组nums,目的数值target 要求输出:如果target存在在数组中,则输出其index,否则输出-1 1. 将原数组通过[left,right]两个索引划分范围,初值left=0,right=数组的最后一 阅读全文
摘要:
Go语言中的slice表示一个具有相同类型元素的可变长序列,语言本身提供了两个操作方法: 1. 创建:make([]T,len,cap) 2. 追加: append(slice, T ...) 同时slice支持随机访问。本篇文章主要对slice的具体实现进行总结。 ## 1. 数据结构 go语言的 阅读全文
摘要:
众所周知,Mysql的事务隔离级别分为4个,分别是READ-UNCOMMITED,READ-COMMITED,REPEATABLE-READ,SERIALIZABLE,在常规数据库概论中,前三种事务隔离级别会带来脏读、不可重复读、幻读的问题,对应关系如下: ||脏读|不可重复读|幻读 | | | | 阅读全文
摘要:
## 单调性 单调性是数学中使用的一种常见性质,通常用于描述函数,在高等数学中的定义常常为: 设函数f(x)在区间I上有定义,如果对于I上的任意两个数x1和x2,当x1f(x2)),则称函数f(x)在区间I上是单调递增的(或者单调递减的)。 例如如下图像就是两个单调函数。 ![](https://i 阅读全文
摘要:
提要:本系列文章主要参考`MIT 6.828课程`以及两本书籍`《深入理解Linux内核》` `《深入Linux内核架构》`对Linux内核内容进行总结。 内存管理的实现覆盖了多个领域: 1. 内存中的物理内存页的管理 2. 分配大块内存的伙伴系统 3. 分配较小内存的slab、slub、slob分 阅读全文