(未解决)不同显卡跑出来的模型精度不一样

参考链接
一个由GPU型号不同导致模型掉点问题的排查过程TF32 vs FP32
https://blog.csdn.net/wohenibdxt/article/details/124542075

怪不得说深度学习是神学,本来在精度%1就很重要的情况下,发现3090和4090跑出来的结果是不一样的。。。。。。。。。。

一些发现

服务器1:30904
服务器2:4090
3
服务器3:4090*4

只要随机种子一致,发现只是显卡影响精度,不是系统环境和设备,例如:

服务器1的3090每一张显卡每次跑出来的精度一致;
服务器2的4090每一张显卡每次跑出来的精度一致;
并且!:
服务器2和服务器3的4090每一张显卡每次跑出来的精度一致。

所以可以得出结论,其他条件一样的情况下,相同显卡跑出来的精度一致

posted @ 2024-12-09 21:17  JaxonYe  阅读(23)  评论(0编辑  收藏  举报