上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 73 下一页
摘要: 主节点(master_ip + master_port)责协调所有其他节点和进程的工作,由主节点所在服务器的IP地址和主节点进程的端口号来确定主节点。主节点还负责监控系统状态、处理任务分配、结果汇总等任务,因此是整个系统的关键部分。 节点编号(node_rank)是系统中每个节点的唯一标识符,用于区 阅读全文
posted @ 2024-12-08 11:45 Picassooo 阅读(133) 评论(0) 推荐(0)
摘要: gradient_accumulation_steps --梯度累加理解_gradient accumulation step-CSDN博客 阅读全文
posted @ 2024-12-08 11:23 Picassooo 阅读(226) 评论(0) 推荐(0)
摘要: 大模型超详细解读 (目录) - 知乎 大语言模型LLM之GPT系列 - Picassooo - 博客园 大语言模型LLM之LLaMa系列 - Picassooo - 博客园 大语言模型LLM之MoE系列 - Picassooo - 博客园 An Introduction to VLMs: The F 阅读全文
posted @ 2024-12-07 11:38 Picassooo 阅读(76) 评论(0) 推荐(0)
摘要: 大模型超详细解读 (目录) - 知乎 MoE 系列超详细解读 (一):Soft MoE:一种完全可微的稀疏 Transformer - 知乎 MoE 系列超详细解读 (二):V-MoE:视觉领域的稀疏门控混合专家模型 - 知乎 MoE 系列超详细解读 (三):ST-MoE:设计稳定可迁移的稀疏专家模 阅读全文
posted @ 2024-12-07 11:36 Picassooo 阅读(180) 评论(0) 推荐(0)
摘要: 大模型超详细解读 (目录) - 知乎 LLM 系列超详细解读 (一):GPT:无标注数据的预训练生成式语言模型 - 知乎 LLM 系列超详细解读 (二):GPT-2:GPT 在零样本多任务学习的探索 - 知乎 LLM 系列超详细解读 (三):GPT-3:大型语言模型是少样本学习器 - 知乎 LLM 阅读全文
posted @ 2024-12-07 11:33 Picassooo 阅读(110) 评论(0) 推荐(0)
摘要: 大模型超详细解读 (目录) - 知乎 LLM 系列超详细解读 (六):LLaMa:开源高效的大语言模型 - 知乎 LLM 系列超详细解读 (七):LLaMa 2:开源微调的聊天大语言模型 - 知乎 阅读全文
posted @ 2024-12-07 11:30 Picassooo 阅读(48) 评论(0) 推荐(0)
摘要: CONFIG=$1 GPUS=$2 NNODES=${NNODES:-1} NODE_RANK=${NODE_RANK:-0} PORT=${PORT:-29500} MASTER_ADDR=${MASTER_ADDR:-"127.0.0.1"} PYTHONPATH="$(dirname $0)/ 阅读全文
posted @ 2024-12-04 11:39 Picassooo 阅读(165) 评论(0) 推荐(0)
摘要: 史上最全Carla教程 |(一)Carla的基本架构 - 知乎 史上最全Carla教程 |(二)Carla安装 - 知乎 史上最全Carla教程 |(三)基础API的使用 - 知乎 史上最全Carla教程 |(四)同步模式 - 知乎 史上最全Carla教程 |(五)交通管理器 - 知乎 史上最全Ca 阅读全文
posted @ 2024-11-28 17:25 Picassooo 阅读(395) 评论(0) 推荐(0)
摘要: Sparse4D系列算法:迈向长时序稀疏化3D目标检测的新实践 - 知乎 阅读全文
posted @ 2024-11-27 16:12 Picassooo 阅读(109) 评论(0) 推荐(0)
摘要: 顶会论文写作建议(上):宏观布局,避免“hard to follow” - 知乎 阅读全文
posted @ 2024-11-27 15:22 Picassooo 阅读(23) 评论(0) 推荐(0)
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 73 下一页