我的随笔

GRPO （Group Relative Policy Optimization ） Antel 2025-02-17 19:23 阅读:1112 评论:0 推荐:0

ChatGLM.cpp的量化处理 Antel 2023-11-08 22:00 阅读:525 评论:0 推荐:0

ggml的量化处理 Antel 2023-11-07 20:15 阅读:1013 评论:3 推荐:0

Proximal Policy Optimization(PPO)算法原理介绍学习笔记 Antel 2023-07-25 00:03 阅读:6305 评论:0 推荐:0

LLM + TensorRT 加速大模型 Antel 2023-07-18 20:25 阅读:2775 评论:5 推荐:1

大模型训练常见工具概念 Antel 2023-07-03 20:05 阅读:1627 评论:0 推荐:0

ML/NLP中的一些术语/公式备忘录 Antel 2022-10-27 20:36 阅读:245 评论:0 推荐:0

spark学习记录之join引发重复计算 Antel 2022-09-16 19:00 阅读:290 评论:3 推荐:0

spark学习记录之withColumn重复计算 Antel 2022-09-16 18:59 阅读:539 评论:0 推荐:0

cgroup限制PySpark内存使用 Antel 2022-04-06 16:37 阅读:1125 评论:0 推荐:0

Antel