[常用工具] cvat安装与使用指北

cvat是一个非常好用的标注工具,但是也是非常难以安装的标注工具,所以本文简单讲一讲如何安装与使用cvat。cvat最好在ubuntu18.04安装,windows平台安装难度很大,然后在其他平台使用。

1 安装

安装其实一步一步按照官方教程执行就好了,官方地址文档为cvat安装文档。安装最大的问题就是网速不好。具体步骤如下。

step1 安装docker

cvat在docker下运行,所以慢慢安装吧。

sudo apt-get update
sudo apt-get --no-install-recommends install -y \
  apt-transport-https \
  ca-certificates \
  curl \
  gnupg-agent \
  software-properties-common
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository \
  "deb [arch=amd64] https://download.docker.com/linux/ubuntu \
  $(lsb_release -cs) \
  stable"
sudo apt-get update
sudo apt-get --no-install-recommends install -y docker-ce docker-ce-cli containerd.io

step2 获取权限

在没有root权限的情况下运行docker需要获取权限,获取权限后务必重启系统。

sudo groupadd docker
sudo usermod -aG docker $USER

step3 获取权限

安装docker-compose(1.19.0或更高版本)。Compose是用于定义和运行多容器Docker应用程序的工具

sudo apt-get --no-install-recommends install -y python3-pip python3-setuptools
sudo python3 -m pip install setuptools docker-compose

step4 克隆cvat源代码

官方github仓库很慢,所以我就用了gitee镜像。

sudo apt-get --no-install-recommends install -y git
git clone https://gitee.com/luohenyueji/cvat
cd cvat

step5 构建docker镜像

这一步是最难也是耗时最长的一步,会下载很多东西包括一堆python库,所以慢慢等待。对于python库得安装建议使用镜像。具体做法,打开上一步下载的源代码目录cvat/Dockerfile文件,找到Install requirements这项。然后修改并添加相应的python镜像。我用的是阿里云镜像,可以换成别的。

#RUN DATUMARO_HEADLESS=1 python3 -m pip install --no-cache-dir -r /tmp/requirements/${DJANGO_CONFIGURATION}.txt
RUN DATUMARO_HEADLESS=1 python3 -m pip install -r /tmp/requirements/${DJANGO_CONFIGURATION}.txt -i https://mirrors.aliyun.com/pypi/simple/

然后在cvat目录输入以下指令就慢慢等待吧,如果中途安装失败,再次输入指令就好了,注意要使用sudo。

sudo docker-compose build

step6 运行Docker容器和创建管理员用户
这一步要下载公共docker映像,耗时看网速,但是不会太久。

docker-compose up -d

这一步结束后,就能打开你的cvat网站,但是需要用谷歌浏览器使用。安装过了谷歌浏览器就不用管,没有见安装方法ubuntu18.10安装chrome浏览器

这时候谷歌浏览器打开localhost:8080就能够看到cvat页面,如下所示

点击creaate an account就能够创建普通用户,但是第一次使用最好创建管理员账户,具体看下一步。

输入以下命令,然后有提示创建管理员账户密码就行了。

docker exec -it cvat bash -ic 'python3 ~/manage.py createsuperuser'

step7 关闭cvat服务

运行step6后,哪怕重启服务器,cvat服务还是继续运行的。要关闭在cvat目录输入以下指令:

docker-compose down

要重新开启就重复step6。

2 使用

cvat的使用具体不多说,官方文档很详细,或者查看文章CVAT 用户指南。本文具体讲几个配置要点。

2.1 其他机器访问cvat服务器

如果要在cvat服务器之外访问,需要指定CVAT_HOST环境变量。最好的方法是创建docker-compose.override.yml并将所有其他设置放在此处。具体做法先把docker-compose.yml复制到cvat目录后命名为docker-compose.override.yml。然后修改docker-compose.override.yml。改动services/cvat/labels/traefik.http.routers.cvat.rule和services/cvat_ui/labels/traefik.http.routers.cvat.rule,将localhost改为你的服务器ip,例如改服务器ip为114.114.114.114。

services:
  cvat:
    labels:
      #- traefik.http.routers.cvat.rule=Host(`${CVAT_HOST:-localhost}`) &&     
      - traefik.http.routers.cvat.rule=Host(`${CVAT_HOST:-114.114.114.114}`) && 
          PathPrefix(`/api/`, `/git/`, `/opencv/`, `/analytics/`, `/static/`, `/admin`, `/documentation/`, `/django-rq`)
  cvat_ui:
    labels:
      # - traefik.http.routers.cvat-ui.rule=Host(`${CVAT_HOST:-localhost}`) 
      - traefik.http.routers.cvat-ui.rule=Host(`${CVAT_HOST:-114.114.114.114}`)
  traefik:
    ports:
      - 8080:8080 # 修改端口
      - 8090:8090

然后step6启动的命令改为

docker-compose -f docker-compose.override.yml up

然后在另外一台电脑(系统版本无所谓可以是windows或者linux)的谷歌浏览器中,输入114.114.114.114:8080即可访问。要注意的是,重启或者关闭命令行后,服务自动关闭。但是关闭命令窗口前需要输入step7的关闭命令。

2.2 共享目录配置

通常情况下我们创建标注任务,需要自己上传数据或者选择某个硬盘地址的数据。自己上传数据当数据量过大很容易崩溃(大概超过1万张图片就会特别慢),所以大型数据选择某个硬盘地址的数据最靠谱,就是下图中的connected file share。

具体需要修改我们上一步的docker-compose.override.yml文件,一共需要添加两处。

第一处

在services/cvat/environment中添加CVAT_SHARE_URL项,内容为"Mounted from {/home/my/data} host directory"。{}中是你要载入的数据地址,注意修改。然后services/cvat/volumes中添加cvat_share项,内容为- cvat_share:/home/django/share:r。

services:

  cvat:
    environment:
      DJANGO_MODWSGI_EXTRA_ARGS: ''
      ALLOWED_HOSTS: '*'
      CVAT_REDIS_HOST: 'cvat_redis'
      CVAT_POSTGRES_HOST: 'cvat_db'
      CVAT_SHARE_URL: "Mounted from {/home/my/data} host directory" # 新加
    volumes:
      - cvat_data:/home/django/data
      - cvat_keys:/home/django/keys
      - cvat_logs:/home/django/logs
      - cvat_models:/home/django/models
      - cvat_share:/home/django/share:ro # 新加

第二处

第二处在volumes下添加cvat_share项目,直接复制下面的命令就行了,注意将volumes/cvat_share/driver_opts/device中的内容改为你要载入的数据地址。

volumes:
  cvat_db:
  cvat_data:
  cvat_keys:
  cvat_logs:
  cvat_models:
  cvat_share: # 整块新加
    driver_opts:
      type: none
      device: {/home/my/data}
      o: bind

然后重启,建立任务时就可以选择硬盘文件路径地址了。

2.3 标注替换

cvat能够通过模型打伪标签,实现自动标注的功能,但是载入模型比较麻烦。个人觉得这个自动标注功能最好不要用,直接本地模型给图像打标注,然后替换标注文件即可。或者你想查看已有标注文件也可以用这种方式。具体如下

step1 下载标注

建立图像数据标注任务,然后下载你本地保存同类型的标注,比如我已经有了当前demo任务的pascal标注,我就下载pascal标注。如下图所示:

step2 替换标注文件

在远程服务器下载标注文件后,会得到一个压缩包,解压压缩包找到标注文件。这些标注文件都是空的,用已有标注文件替换这些标注文件。然后原封不动重新打包压缩整个文件夹。

重新打包后的压缩文件包注意和原来的文件包内容都是一样的,比如原来是a.zip,现在我们上传的压缩包除了标注,其他和a.zip中的内容一样。然后压缩文件夹,我们可以改名为b.zip,但是不能是a.rar。

step3 上传标注

我们直接上传上一步的标注压缩包,替换文件就行了。

最后倒入后的标注如下图所示,成功搞定。

2.4 其他使用

用户权限管理

比如管理普通用户能否标注,创建任务,可以参考CVAT用户管理

windows下安装cvat

参考CVAT windows安装。但是非常不建议在windows下安装cvat。

cvat自动标注

参考cvat自动标注实现cvat加载模型标注数据。cvat自动标注也非常不推荐使用,具体查看2.3。

3 参考

posted @ 2022-12-19 22:41  落痕的寒假  阅读(437)  评论(0编辑  收藏  举报