DataLoader worker (pid 2287) is killed by signal: Killed. pytorch训练解决方法

1.原因

可能是因为pytorch训练过程太费内存了,导致服务器内存不够,触发OS的保护机制,直接杀死了进程

2.解决方案

增加机器的swap区,以此来增加内存的交换区来“假装”增加内存条

2.1查询内存和交换区大小的命令

free

2.2先禁止swap功能

sudo swapoff /swapfile

执行完这个命令后,你用free会发现,swap区大小为零

2.3增加swapfile大小

sudo dd if=/dev/zero of=/swapfile bs=1M count=1024 oflag=append conv=notrunc

这个命令会在原swapfile基础上追加一个G的空间,如果空间不够,更改count的值即可。

2.4设置这个文件为swap分区的挂载点

sudo mkswap /swapfile

2.5启用swap

sudo swapon /swapfile

2.6使用free查看分区是否增加了

 

posted @ 2019-05-20 14:59  回溯法  阅读(5072)  评论(0编辑  收藏  举报