后来,好多人代替了好多人☁️|

little小新

园龄:2年6个月粉丝:8关注:0

6、seq2seq - Transformer-Encoder、Transformer-Decoder
摘要: Attention - 注意力机制 seq2seq是 Sequence to Sequence 的简写,seq2seq模型的核心就是编码器(Encoder)和解码器(Decoder)组成的 通过在seq2seq结构中加入Attention机制,是seq2seq的性能大大提升,先在seq2seq被广泛
17
0
0
5.深度学习的经典模型
摘要: RNN - Recurrent Neural Network RNN跟传统神经网络最大的区别在于每次都会将前一次的输出结果,带到下一次的隐藏层中,一起训练。也就是说,RNN前面所有的输入都会对未来的输出产生影响,就是把所有的输入都带到下一次 如下图,RNN中短期的记忆影响较大(如橙色区域),但是长期
3
0
0
4.优化器 - 模型评估
摘要: 优化器 - optimizer 优化器就是在深度学习反向传播过程中,指引损失函数(目标函数)的各个参数往正确的方向更新合适的大小,使得更新后的各个参数损失函数(目标函数)值不断逼近全局最小 优化器不计算梯度,他只是梯度的更新者,它决定了以什么样的形式更新参数 如果损失函数是一座山峰,优化器会通过梯度
24
0
0
3.正向传播与反向传播 - 学习率LR - Batch size - 激活函数 - 损失函数
摘要: 正向传播 尽量降低损失函数 梯度 梯度是一个向量(矢量),函数在一点处沿着该点的梯度方向变化最快,变化率最大。换而言之,自变量沿着梯度方向变化,能够使应变量(函数值)变化最大。 如图:如果想要 w 下降最快就沿着梯度的负方向下降,就能降低损失函数 方向传播 更新各个参数的值(如图中 w 的值),重新
49
0
0
2.模型训练流程
摘要: 基础名词解释 样本:一条数据 特征:被观测对象的可测量特征,例如西瓜的颜色、瓜蒂、纹路、敲击声等 特征向量:用一个d维向量表征一个样本的所有或部分特征; 向量(数组) - [1,2,3] 标签/真实值:样本特征对应的真是类型或者真是取值,即正确答案 数据集(dataset):多条样本组成的集合 训练
6
0
0
1.初识机器学习
摘要: LM LLM : 大语言模型 LMM : 多模态模型(处理图片视频等) 所谓模型,就是一个包含了大量未知参数的函数 所谓训练,就是通过大量的数据去迭代逼近这些未知参数的最优解 机器学习:是一门专门研究计算机怎盐模拟或实现人类的学习行为,以获取新的知识领域或技能,重新组织已有的知识结构使之不断改善自身
19
0
0
8、C语言-运算符
摘要: 数字的相加 注意:数据类型不一样的不能直接相加、需要先转成一样的数据类型 隐式转换 把一个取值范围小的、自动转成取值范围大的 short、char类型的数据在计算的时候,先提升位为int,再进行运算 强制转换 将数据类型大的转为小的 格式:目标数据类型 变量名=(目标数据类型)被强转的数据 #inc
6
0
0
7、C语言-标识符、键盘录入scanf
摘要: 变量名命名规则 由数字、字母、下划线_ 组成 不能以数字开头 不能是关键字(如 if等) 严格区分大小写 建议 变量名尽量都小写 用英文单词,做到见名知意 代码文件名 尽量都小写 键盘录入scanf scanf,是scanner format的缩写、是C语言提供的一个函数 作用:获取用户在键盘上输入
10
0
0
6.C语言-数据的类型大小
摘要: 1字节= 0 0 0 0 0 0 0 0 一个字节 = 8 位 1024 = 1KB 1024KB = 1MB 1024MB = 1G 1024GB = 1TB 1024TB = 1PB 1024pB = 1EB 1024EB = 1ZB 1024ZB = 1YB 整形 int - 为4个字节 相当
24
0
0
5.C语言-代码中的进制表示与转换
摘要: 八进制 = 三个二进制为一组 十六进制 = 四个二进制为一组 // 进制转换 int main() { //二进制:由0和1组成,在代码中以 0b开头 int a = 0b10; printf("%d", a); //十进制:由0~9组成,无需加前缀 int b = 10; printf("%d",
39
0
0
1 2 3 4 5 ··· 26 下一页
1 2 3 4 5 ··· 26 下一页
点击右上角即可分享
微信分享提示
深色
回顶
收起