深度学习 (11) | 记忆化搜索 (1) | 数据并行 (1) | request/reply (1) |
模板 (9) | 蚁群算法 (1) | 数学 (1) | push/pull (1) |
动手学深度学习 (6) | 莫比乌斯函数 (1) | 思维题 (1) | publish/subscribe (1) |
d2l (5) | 自动求导 (1) | 微积分 (1) | Prompt tuning (1) |
数据结构 (4) | 网络 (1) | 并查集 (1) | PEFT (1) |
PyTorch (4) | 编译优化 (1) | 多项式 (1) | OI (1) |
NLP (4) | 线性回归 (1) | 多层感知机 (1) | MLP (1) |
dp (4) | 约数和函数 (1) | 多GPU训练 (1) | MixGen (1) |
平衡树 (3) | 约数个数函数 (1) | 可撤销并查集 (1) | LLaMA (1) |
Treap (3) | 粒子群算法 (1) | 发布/订阅 (1) | linux (1) |
Torch (3) | 硬件 (1) | 博弈论 (1) | ICPC (1) |
随机算法 (2) | 状压dp (1) | 分布偏移 (1) | GPT2 (1) |
组会 (2) | 汉语 (1) | 交叉熵 (1) | dropout (1) |
李沐 (2) | 比喻 (1) | ZeroMQ (1) | Data Parallel (1) |
多模态 (2) | 欧拉函数 (1) | yacd (1) | Codeforces (1) |
分数规划 (2) | 模型 (1) | XCPC (1) | Coca (1) |
二分 (2) | 概率 (1) | weight decay (1) | clash (1) |
ecnuoj (2) | 树上dp (1) | VLMo (1) | CCPC (1) |
CV (2) | 查阅文档 (1) | urllib (1) | BLIP (1) |
AtCoder (2) | 权重衰减 (1) | TSP (1) | BEiTv3 (1) |
ABC (2) | 暂退法 (1) | SwiGLU (1) | ALBEF (1) |
集合 (1) | 智能优化方法 (1) | Splay (1) | AIM (1) |
通信 (1) | 旅行商问题 (1) | SoftMax回归 (1) | Adapter (1) |
读论文 (1) | 数论 (1) | RoPE (1) | |
请求/应答 (1) | 数据集 (1) | RMSNorm (1) |