摘要: 背景 本人在安装deepspeed后遇到了这个报错,明眼人一看就是缺库,但是搜索到的解决方案(凌漪_, 2023)说是设置一个环境变量,实在是治标不治本,而且对本人来说连标都治不了。其他的博客尚未看到解决此问题的。 分析 这个so文件理论上应该在安装deepspeed的过程中就自动编译好了,但是现在 阅读全文
posted @ 2024-07-17 20:10 王冰冰 阅读(44) 评论(2) 推荐(0) 编辑
摘要: 1. 查看环境变量 根据进程pid看,以121927号进程为例: cat /proc/121927/environ | tr '\0' '\n' 每个环境变量都以'\0'结束,直接cat会不方便查看,将'\0'替换为'\n'可以方便查看。注意,tr后必须加单引号,不然参数会被shell转义为0和n。 阅读全文
posted @ 2024-07-15 19:30 王冰冰 阅读(10) 评论(2) 推荐(0) 编辑
摘要: 0. Motivation 由于未知原因,docker无法拉取镜像,我们设置一下环境变量http_proxy。 1. Preliminary 需要注意的是,你在shell终端设置http_proxy是没用的,不然这篇博客也不会出现。 2. Method docker守护进程是通过systemctl启 阅读全文
posted @ 2024-06-28 13:14 王冰冰 阅读(17) 评论(4) 推荐(0) 编辑
摘要: 最近阅读论文,再回顾一些基础的线性代数知识 1. 行列式 转置不改变行列式的值 \[|A|=|A^T| \] 对某一行加上另外一行的K倍,不改变行列式的值 只要矩阵有一行为0,行列式就是0。因为行列式等于任意一行/列的元素和其代数余子式的乘积之和,元素本身是0,行列式就是0 \[|A|=a_{i0} 阅读全文
posted @ 2024-06-24 11:13 王冰冰 阅读(11) 评论(1) 推荐(0) 编辑
摘要: 分布式训练使用方法见博主之前的博客,本文介绍一些注意事项。 分布式训练用torchrun进行,要注意: 所有进程必须固定随机种子,不然可能会导致训练时不同进程的样本不一致,尤其是涉及随机数时,比如train_test_split。 export LOGLEVEL=DEBUG可以修改torchrun的 阅读全文
posted @ 2024-06-18 16:25 王冰冰 阅读(24) 评论(2) 推荐(0) 编辑
摘要: 前排提醒 由于本人的服务器只有1G内存,但是mysql启动就占用500M,系统占用500M,导致wordpress计划流产。 Abstract 本文将记录本人使用wordpress搭建博客的流程。 0. Requirements 系统:Ubuntu 22.04 根据wordpress官网指引,需要如 阅读全文
posted @ 2024-06-02 20:25 王冰冰 阅读(15) 评论(2) 推荐(0) 编辑
摘要: 我在使用ssh远程端口转发时,即使设置了0.0.0.0,也是监听127.0.0.1,经过查询发现: https://www.cnblogs.com/xuyaowen/p/ssh-remote-forward.html 需要修改sshd中的一项配置:GatewayPorts yes 然后重启sshd即 阅读全文
posted @ 2024-06-01 01:32 王冰冰 阅读(27) 评论(2) 推荐(0) 编辑
摘要: Abstract 本文总结了如何下载各种linux发行版上的包管理器打包好的二进制软件并使用的方法。 1. Introduction linux安装软件一般要么是用apt,要么是yum等,但是这些包管理器都需要root权限,在没有root权限时,我们可以用conda安装部分软件,但是有的软件cond 阅读全文
posted @ 2024-05-20 17:01 王冰冰 阅读(25) 评论(2) 推荐(0) 编辑
摘要: 前排提醒:本文仅针对git新手,因此部分表述可能会略显不妥,git老手请自行忽略。 创建远程仓库 这一步各个网站各有不同,故不作过多介绍。但是需要注意,除非你准备创建一个全新的项目,否则不要勾选init with readme等类似选项,确保创建的是空仓库。 以下内容参考自GitLab和GitHub 阅读全文
posted @ 2024-05-17 14:46 王冰冰 阅读(23) 评论(2) 推荐(0) 编辑
摘要: 由于pytorch的python语句执行和CUDA后端实际上是异步执行的,所以当CUDA runtime报错时,并不一定能正确地反映在python抛出的错误语句中,因此,可以添加一个环境变量来实现: CUDA_LAUNCH_BLOCKING=1 这里再补充一些关于cuda和pytorch异步执行的知 阅读全文
posted @ 2024-05-15 20:15 王冰冰 阅读(32) 评论(3) 推荐(0) 编辑