03 2024 档案
摘要:如果一个机器上有多个gpu,可以使用多gpu训练。 一般数据量和模型比较大的时候训练速度会有明显的提升,模型和数据比较小的时候反而可能因为数据通信原因导致性能下降。 下面是一个简单的例子: import time import torch import torchvision.models from
阅读全文
摘要:有时候pip下载安装特别慢,可以考虑更换下载源: 清华源: pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple 阿里源: pip config set global.index-url https://mi
阅读全文
摘要:主要用了两个库:pipdeptree和pyecharts。 pipdeptree用来解析所有库的依赖关系。 pyecharts用来显示依赖的网络关系。 通常的方法应该是通过输入下面命令: pipdeptree --json-tree > pkg.json 得到关系树文件,然后解析该文件并在pyech
阅读全文
摘要:混合精度训练通常会结合使用单精度浮点数(float32)和半精度浮点数(float16),以提高训练效率和减少内存占用。 代码中关键在于两个地方: 1. 在with autocast():下,模型的前向传播和损失计算放在自动混合精度加速环境中进行。 2. 使用scaler对象进行混合精度训练的管理。
阅读全文