博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

我的随笔

GRPO (Group Relative Policy Optimization ) Antel 2025-02-17 19:23 阅读:1112 评论:0 推荐:0   
ChatGLM.cpp的量化处理 Antel 2023-11-08 22:00 阅读:525 评论:0 推荐:0   
ggml的量化处理 Antel 2023-11-07 20:15 阅读:1013 评论:3 推荐:0   
Proximal Policy Optimization(PPO)算法原理介绍学习笔记 Antel 2023-07-25 00:03 阅读:6305 评论:0 推荐:0   
LLM + TensorRT 加速大模型 Antel 2023-07-18 20:25 阅读:2775 评论:5 推荐:1   
大模型训练常见工具概念 Antel 2023-07-03 20:05 阅读:1627 评论:0 推荐:0   
ML/NLP中的一些术语/公式备忘录 Antel 2022-10-27 20:36 阅读:245 评论:0 推荐:0   
spark学习记录之join引发重复计算 Antel 2022-09-16 19:00 阅读:290 评论:3 推荐:0   
spark学习记录之withColumn重复计算 Antel 2022-09-16 18:59 阅读:539 评论:0 推荐:0   
cgroup限制PySpark内存使用 Antel 2022-04-06 16:37 阅读:1125 评论:0 推荐:0