该文被密码保护。 阅读全文
posted @ 2026-01-13 17:42
blcblc
阅读(0)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2026-01-13 17:40
blcblc
阅读(0)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2026-01-13 16:58
blcblc
阅读(0)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2026-01-13 15:39
blcblc
阅读(0)
评论(0)
推荐(0)
摘要:
https://zhuanlan.zhihu.com/p/699560595 使用FP8加速PyTorch训练的两种方法总结 https://zhuanlan.zhihu.com/p/1910049304422377356 E4M3 用于权重、E5M2 用于激活值 https://blog.csdn 阅读全文
posted @ 2026-01-13 15:32
blcblc
阅读(16)
评论(0)
推荐(0)
摘要:
https://zhuanlan.zhihu.com/p/1926404665517536405 显存减半,性能不减:基于bitsandbytes的大模型量化的底层逻辑与实战 里面有一些代码,勉强能跑起来 这篇参考: https://zhuanlan.zhihu.com/p/665601576 阅读全文
posted @ 2026-01-13 14:56
blcblc
阅读(2)
评论(0)
推荐(0)
摘要:
https://zhuanlan.zhihu.com/p/700873851 一文理解 GPU 张量核心(Tensor Core) 建议在支持 8-bit 张量核心的 NVIDIA GPU(Turing、Ampere 及更新架构,如 T4、RTX 20/30/40、A100 等)上运行。 阅读全文
posted @ 2026-01-13 14:03
blcblc
阅读(4)
评论(0)
推荐(0)
摘要:
https://zhuanlan.zhihu.com/p/666234324 QLoRA(Quantized LoRA)详解 阅读全文
posted @ 2026-01-13 13:35
blcblc
阅读(5)
评论(0)
推荐(0)
摘要:
https://blog.csdn.net/weixin_45116099/article/details/136682407 https://developer.aliyun.com/article/1053404 阅读全文
posted @ 2026-01-13 12:28
blcblc
阅读(4)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2026-01-13 01:28
blcblc
阅读(0)
评论(0)
推荐(0)

浙公网安备 33010602011771号