次花椒的喵酱

2025年10月12日

摘要： 🧠 一、SimAM 的基本思想 SimAM（Simple Attention Module）是一种无参数的注意力机制（即不增加可学习参数），发表于 📝 SimAM: A Simple, Parameter-Free Attention Module for Convolutional Neur 阅读全文

posted @ 2025-10-12 19:04 次花椒的喵酱阅读(616) 评论(0) 推荐(0)

2025年9月17日

数据集中valid的作用

摘要：简单来说，valid（或 val）文件夹的存在是为了在模型训练过程中，定期、独立地评估模型的性能，以便进行模型调优、防止过拟合和选择最佳模型。它是机器学习工作流中至关重要的一环。一般的数据集结构： 1. Train（训练集）目的：这是模型“学习”所用的主要数据。模型通过反复查看这些图片和对应的标阅读全文

posted @ 2025-09-17 18:58 次花椒的喵酱阅读(138) 评论(0) 推荐(0)

梯度下降算法

摘要： Gradient Descent 梯度下降一、核心思想：一个最经典的比喻想象一下，你是一个蒙着眼睛的登山者，被困在一片漆黑的山林中。你的目标是走到山谷的最低点（寻找最低点）。你会怎么做？你会用脚感受一下周围的地面，找出哪个方向是“下坡”最陡的。然后朝着那个最陡的下坡方向迈出一步。到达新位阅读全文

posted @ 2025-09-17 18:24 次花椒的喵酱阅读(125) 评论(0) 推荐(0)

2025年9月16日

第五天学习：Mamba

摘要：流水不争先，争的是滔滔不绝—— 每日渐进，终抵远方 1.Manba是什么？Manba牢大Man！——Transformer 的“阿喀琉斯之踵” 要理解Mamba，首先必须明白当今的王者——Transformer——有什么核心痛点。Transformer的成功源于其Self-Attention（自注意阅读全文

posted @ 2025-09-16 11:05 次花椒的喵酱阅读(60) 评论(0) 推荐(0)

2025年9月12日

吻得太逼真

摘要：无论怎么讲我都觉得虚伪陪伴你那么久你说是受罪从前到现在当我是谁你这花心蝴蝶昨夜陪你醉伤到我心碎你竟说我和你不配完全忘记往日为何能与我彻夜缠绵和你吻吻吻吻吻你吻得太逼真让我把虚情假意当作最真心的亲吻怪自己来不及区分你对我是酷爱是敷衍我想问问问问问我该怎么脱身你却说花花世阅读全文

posted @ 2025-09-12 17:50 次花椒的喵酱阅读(13) 评论(0) 推荐(0)

Sigmoid和tanh

摘要：这是很多人困惑的地方。它们俩形状很像，都是“S”型，但有一个最关键的区别：特性 tanh Sigmoid 输出范围 -1 到 1 0 到 1 对称性关于原点(0,0)对称不对称常用场景隐藏层（效果好，因为均值接近0，可使后续计算更稳定）输出层（尤其适合处理概率问题，因为概率范围是0到1）阅读全文

posted @ 2025-09-12 16:19 次花椒的喵酱阅读(40) 评论(0) 推荐(0)

第四天学习：LSTM

摘要：流水不争先，争的是滔滔不绝—— 每日渐进，终抵远方 LSTM（Long Short-Term Memory，长短期记忆网络）他的前身是RNN（循环神经网络），为啥我们拿着好端端的RNN不用，非要寻找其他的网络算法呢？这是因为RNN本身存在缺陷： RNN的初衷：处理序列数据（如句子、语音、时间序列阅读全文

posted @ 2025-09-12 15:14 次花椒的喵酱阅读(16) 评论(0) 推荐(0)

2025年9月11日

谁拿了谁的伞？

摘要：我：要去上课了，哎，不想去上课，我想在工位带着。算了，还是去吧。我的伞放在工位门口左边，光线很黑，拿错了雨伞，拿成了学长的雨伞去上课。一到教室，刚坐下，老师就开始说，不让坐最后一排啊，你们几个快做前面去，然后我就拿着我的伞坐到了前面。这课是真无聊，我准备上完第一小节直接跑了。走的时候，我拿了我桌兜里阅读全文

posted @ 2025-09-11 21:44 次花椒的喵酱阅读(30) 评论(0) 推荐(0)

第三天学习：Self-Attention与Cross-Attention

摘要：流水不争先，争的是滔滔不绝—— 每日渐进，终抵远方 Self-Attention (自注意力机制) 定义：Query, Key, Value 全部来自于同一个序列（比如同一个句子）。目的：捕捉一个序列内部元素之间的相互关系。它让序列中的每个元素都与其他所有元素“对话”一次，从而获得一个融入了全局上阅读全文

posted @ 2025-09-11 16:49 次花椒的喵酱阅读(534) 评论(0) 推荐(0)

2025年9月10日

第二天学习：Attention

摘要：注意力机制：我们会把焦点聚焦在比较重要的事物上。 Q：查询对象 V：被查询对象要通过计算Q和V里的事物的重要度，也就是事物的相似度（是否接近）计算。通过点乘的方法来计算Q和K里的每一个事物的相似度，就可以拿到Q和k1（k2....）的相似值a1（a2.....）。然后做一层softmax（a1 阅读全文

posted @ 2025-09-10 14:49 次花椒的喵酱阅读(31) 评论(0) 推荐(0)

次花椒的喵酱

公告