一些开源数据标注工具
整理一些工具,方便学习使用
doccano
主要是进行文本处理的
label-studio
比较强大的工具,支持多种数据处理,目前迭代升级也比较快速
audino
进行声音标注的工具,目前不是很活跃了,好久没新的提交信息了
abel-studio-converter
label-studio 提供的通用数据转换服务,可以方便用来快速使用现有的模型
DarkLabel
用来处理视频以及图片标注的,目前不是很活跃,这个工具在老外一个学习视频中有介绍
labelImg
用来进行图片标注的,目前已经合并到label-studio 中了
universal-data-tool
很不错的工具,但是目前维护似乎不是很积极了,支持的数据格式是比较多的
SMART
方便在资源有限的环境进行数据的处理,目前还在维护中,就是star不是很多
fiftyone
处理机器视觉相关的数据
cvat
opencv 团队开源的
说明
同时HumanSignal 团队也在github 上提供了一个方便的集合,整理了不少数据标注工具awesome-data-labeling 很值得看看,
整体来说label-studio 是一个很不错的选择,选择上可以结合自己的业务场景(文件,视频,音频,图片。。。)
参考资料
https://github.com/HumanSignal/awesome-data-labeling
https://github.com/doccano/doccano
https://github.com/HumanSignal/label-studio
https://github.com/midas-research/audino
https://github.com/HumanSignal/label-studio-converter
https://github.com/doccano/awesome-annotation-tools
https://github.com/darkpgmr/DarkLabel
https://github.com/HumanSignal/labelImg
https://github.com/UniversalDataTool/universal-data-tool
https://github.com/RTIInternational/SMART
https://github.com/opencv/cvat
https://opencv.github.io/cvat/docs/administration/basics/installation/
https://github.com/voxel51/fiftyone
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2022-10-14 docker desktop url protocl 技术以及使用
2020-10-14 apache ignite docker集群运行试用
2020-10-14 rr一款强大的应用请求录制以及回放框架
2020-10-14 追踪postgres 后端调用情况
2020-10-14 重置idea 配置的方法
2020-10-14 jdbc连接池工具与pg fdw连接的问题
2019-10-14 ent 基本使用八 索引