摘要:
stream模块一般用于TCP/UDP数据流的代理和负载均衡,通过stream模块我们可以代理转发tcp报文。 stream使用场景 stream主要有两个可用场景。 一是实现流量的代理转发,这里所说的代理转发是只某些端口服务是有源IP地址限制的,例如mysql账户一般是限制了源地址为应用服务器,n 阅读全文
摘要:
%%capture !pip install unsloth==2025.2.5 !pip install --force-reinstall --no-cache-dir --no-deps git+https://github.com/unslothai/unsloth.git from uns 阅读全文
摘要:
转自:https://zhuanlan.zhihu.com/p/442509602 看看论文里的介绍 Similarly to other sequence transduction models, we use learned embeddings to convert the input tok 阅读全文
摘要:
转自:https://www.cnblogs.com/justLittleStar/p/17322197.html 一、熵(PRML) 考虑将A地观测的一个随机变量x,编码后传输到B地。这个随机变量有8种可能的状态,每个状态都是等可能的。为了把x的值传给接收者,需要传输一个3-bits的消息。注意, 阅读全文
摘要:
1.基础知识 在pytorch中,@和*运算符用于不通类型的数数学运算,具体是矩阵乘法和逐元素乘法。 基本知识 运算符功能适用场景示例 @ 矩阵乘法(或点乘) 用于执行线性代数中的矩阵乘法 C = A @ B,其中 A 和 B 为矩阵 * 逐元素乘法 用于对同一形状的张量进行逐元素相乘 C = A 阅读全文
摘要:
转自:https://zhuanlan.zhihu.com/p/525276061 首先说一下Softmax函数,公式如下: 1. 三维tensor(C,H,W) 一般会设置成dim=0,1,2,-1的情况(可理解为维度索引)。其中2与-1等价,相同效果。 用一张图片来更好理解这个参数dim数值变化 阅读全文
摘要:
转自:https://www.cnblogs.com/catnofishing/p/13287322.html detach到底有什么作用呢 首先要明确一个意识:pytorch是动态计算图,每次backward后,本次计算图自动销毁,但是计算图中的节点都还保留。 方向传播直到叶子节点为止,否者一 阅读全文
摘要:
转自:https://zhuanlan.zhihu.com/p/47907312 编者按:关于LSTM,之前我们已经出过不少文章,其中最经典的一篇是chrisolah的《一文详解LSTM网络》,文中使用的可视化图片被大量博文引用,现在已经随处可见。但正如短视频取代纯文字阅读是时代的趋势,在科普文章中 阅读全文
摘要:
转自:https://zhuanlan.zhihu.com/p/115823190 RNN常用来处理序列式问题,本篇采用动图的方式展示RNN的计算过程。最常见的3中RNN网络结构分别为: vanilla RNN long short-term memory (LSTM) gated recurren 阅读全文
摘要:
本文将介绍信息量,熵,交叉熵,相对熵的定义,以及它们与机器学习算法中代价函数的定义的联系。转载请保留原文链接:http://www.cnblogs.com/llhthinker/p/7287029.html 1. 信息量 信息的量化计算: 解释如下: 信息量的大小应该可以衡量事件发生的“惊讶程度”或 阅读全文