连接服务器GPU训练模型
使用GPU训练模型常用命令
1、定时更新显示机器上gpu的情况
watch -n 10 nvidia-smi
2、在终端执行程序时指定GPU
CUDA_VISIBLE_DEVICES=1 python your_file.py
这样在跑你的网络之前,告诉程序只能看到1号GPU,其他的GPU它不可见
3、jupyter远程连接服务器,在服务器安装新建conda环境或者切换建立的环境
4、安装jupyter
pip install jupyter
5、生成配置文件
jupyter notebook --generate-config
6、 打开python,生成秘钥
from notebook.auth import passwd
passwd()
7、然后设置登录密码123456,生成秘钥,并复制秘钥
sha1:0e8427a1bd77:5239768e6efe56733b9927c0a34407c3c469e8b9
8、修改配置文件
vim ~/.jupyter/jupyter_notebook_config.py
9、在打开的文件中,找到以下4处,去掉注释,进行修改
其中,c.NotebookApp.ip='*' 是很多网上给的建议,但实际上替代为你的IP地址,就可以随时根据IP来登陆你的服务器了。
c.NotebookApp.ip='你的IP地址' # 就是多个用户使用ip地址访问
c.NotebookApp.password = u'sha:ce...' # 刚才复制的那个密文,密文一定不要写错,否则密码登不进去
c.NotebookApp.open_browser = False # 禁止自动打开浏览器
c.NotebookApp.port =8888 # 随便指定一个端口
10、在本地机器cmd中ssh连接,密码为1之前设置的123456
ssh -L 8887:localhost:8888 wangtongli@10.68.17.90 -p 3910
8887为服务器设置的端口号