关于 deep-high-resolution-net.pytorch 遇到一些的坑

一、前言

  1. 前段时间在网上看到一个博主发布了一个基于视觉ai的自动辅助瞄准的程序,上上周在微信刷到了这篇文章
  2. 本着试一试的态度,去翻阅了相关的文献,然后开始搞 

  3. 顺嘴一提,作者说 该代码是在Ubuntu 16.04 上使用 python 3.6 开发的。需要 NVIDIA GPU。该代码是使用 4 个 NVIDIA P100 GPU 卡开发和测试的。其他平台或 GPU 卡未经过全面测试。

二、环境

  • 操作系统:Windows 10
  • 显卡:1650(都是坑)
  • 模型:High-Resoultion Net(HRNet)

三、安装依赖相关的坑

  1. HRNet安装:

    git clone https://github.com/leoxiaobin/deep-high-resolution-net.pytorch.git
    

      

  2. 接着就是安装依赖,作者给的是:
    pip install -r requirements.txt

    文本内容如下: 

    EasyDict==1.7
    opencv-python==3.4.1.15
    shapely==1.6.4
    Cython
    scipy
    pandas
    pyyaml
    json_tricks
    scikit-image
    yacs>=0.1.5
    tensorboardX==1.6

  3.  安装shapely报错:解决方法 https://blog.csdn.net/weixin_44601149/article/details/103375247      这里有个小问题就是,根据这位博主所提供的地址,里面并没有py36对应的 这里我尝试直接 pip 1.7.1这个版本,后面没遇到版本冲突问题(没有从这里下,是直接pip)

     

     

  4. No module named ‘pycocotools‘ 解决方法:https://blog.csdn.net/weixin_42410915/article/details/109368497    这个需要按他说的下载再安装
  5.  

     上面并不是没有添加环境,而是我压根就没安装!  附上链接:https://www.jianshu.com/p/9bdeb033e765  我只需要cuda 没管后面所说的cudnn,无需去配置cuda环境变量(应该是默认就配搭好的)

  6. 接着就是经典错误了 

     大致的意思就是我要安装的库,需要本地c++进行编译,现在缺少这个依赖项,我这里为了避免之后遇到这类问题,直接去官网下载相关的依赖

     然后重启,再接着安装,发现问题就解决了!

四、制作库遇到的一些坑(Make libs keng:)

  1. 作者是在乌邦图跑的代码,所以它的这部分代码不支持windows下,但torch支持windows,于是乎就有了

     

     

  2. 这个分支多了lib下新增了一个build_windows.bat nms下对其原有的三个文件进行了修改,我照着改了下,完全没得问题!

     

     

五、对COCO val2017 数据集进行测试遇到的坑

  1.   AssertionError:Invalid device id  

     

     作者默认是四个gpu,咱就一个,所以做如下更改:

     

     

     

  2. BrokenPipError:[Errno 32]  Broken pipe   

 

       这里作者的配置是四个gpu,我就一个,所以直接删掉乘号部分

   3.UserWarning:此DataLoader将创建24个工作进......这个问题其实是还是那个问题,他是4个gpu,我一个,所以我需要除4,将worker参数改为6即可

 

     

 

 

 

然后  这部分就跑通了

 

六、在COCO train2017 数据集上进行训练所遇到的坑

  1. AttributeError:module 'torch.onnx' has no attribute 'set_training'

     

     解决办法

     

     

  2. 然后就是和刚才测试一样的问题,一一修改。
  3. RuntimeError: CUDA out of memory .Trued.to.......这个问题

     

     有人说是让减小batch_size  但会不会影响模型性能我不知道,我将其改为了4(6我依然报错)

     

     

 然后顺利运行到此刻,我发现我忽略了一个问题,我一个gpu需要多少时间才能跑完???????于是乎我后知后觉的去查了下

 

 

 

 

 

 

 

 好耶!!!!

posted @ 2022-04-05 17:08  AubeLiang  阅读(895)  评论(2编辑  收藏  举报