DataLoader worker (pid 2287) is killed by signal: Killed. pytorch训练解决方法
1.原因
可能是因为pytorch训练过程太费内存了,导致服务器内存不够,触发OS的保护机制,直接杀死了进程
2.解决方案
增加机器的swap区,以此来增加内存的交换区来“假装”增加内存条
2.1查询内存和交换区大小的命令
free
2.2先禁止swap功能
sudo swapoff /swapfile
执行完这个命令后,你用free会发现,swap区大小为零
2.3增加swapfile大小
sudo dd if=/dev/zero of=/swapfile bs=1M count=1024 oflag=append conv=notrunc
这个命令会在原swapfile基础上追加一个G的空间,如果空间不够,更改count的值即可。
2.4设置这个文件为swap分区的挂载点
sudo mkswap /swapfile
2.5启用swap
sudo swapon /swapfile
2.6使用free查看分区是否增加了