02 2025 档案
摘要:stream模块一般用于TCP/UDP数据流的代理和负载均衡,通过stream模块我们可以代理转发tcp报文。 stream使用场景 stream主要有两个可用场景。 一是实现流量的代理转发,这里所说的代理转发是只某些端口服务是有源IP地址限制的,例如mysql账户一般是限制了源地址为应用服务器,n
阅读全文
摘要:%%capture !pip install unsloth==2025.2.5 !pip install --force-reinstall --no-cache-dir --no-deps git+https://github.com/unslothai/unsloth.git from uns
阅读全文
摘要:转自:https://zhuanlan.zhihu.com/p/442509602 看看论文里的介绍 Similarly to other sequence transduction models, we use learned embeddings to convert the input tok
阅读全文
摘要:转自:https://www.cnblogs.com/justLittleStar/p/17322197.html 一、熵(PRML) 考虑将A地观测的一个随机变量x,编码后传输到B地。这个随机变量有8种可能的状态,每个状态都是等可能的。为了把x的值传给接收者,需要传输一个3-bits的消息。注意,
阅读全文
摘要:1.基础知识 在pytorch中,@和*运算符用于不通类型的数数学运算,具体是矩阵乘法和逐元素乘法。 基本知识 运算符功能适用场景示例 @ 矩阵乘法(或点乘) 用于执行线性代数中的矩阵乘法 C = A @ B,其中 A 和 B 为矩阵 * 逐元素乘法 用于对同一形状的张量进行逐元素相乘 C = A
阅读全文
摘要:转自:https://zhuanlan.zhihu.com/p/525276061 首先说一下Softmax函数,公式如下: 1. 三维tensor(C,H,W) 一般会设置成dim=0,1,2,-1的情况(可理解为维度索引)。其中2与-1等价,相同效果。 用一张图片来更好理解这个参数dim数值变化
阅读全文