Doccano数据标注工具 - 自动标注(Auto-Labeling)功能
图片如果看不到的可以点击这里:【FlowUs 息流】Doccano数据标注工具 - 自动标注(Auto-Labeling)功能
最近在使用Doccano标注数据时一直不明白Auto Labeling功能怎么使用,后来在Doccano的issue里看到了使用方式,记录一下
-
编写 api 接口并运行
from flask import Flask, request, jsonify @app.route("/predict", methods=["POST"]) def predict(): # 获取text参数 text = request.form.get("text") or request.json.get("text") or request.values.get("text") # 模型推理得到结果 pred = "medical" # or "non-medical" # 返回结果 results= [{"result": pred}] return jsonify(results) if __name__ == "__main__": app.run("0.0.0.0", port=5001)
-
在项目选单中选择
Settings
->Auto Labeling
->Create
新建一项: -
在弹出的窗口中选择一个配置模板,选择
Custom REST Request
: -
点击 Next ,按照上面的 api 填写 url 等参数
-
注意body参数的key为api中request获取的参数名,value为
{{ text }}
: -
输入测试文本点击Test按钮进行测试:
-
点击 Next ,进入到设置映射模板(Set mapping template)选项卡,在Mapping Template的文本框中输入模板:
[ {% for item in input %} { "label": "{{ item.result }}" }{% if not loop.last %},{% endif %} {% endfor %} ]
注意 key 要与 doccano format 里面的保持一致:
Text Classification [{ "label": "Cat" }, ...] Sequence Labeling [{ "label": "Cat", "start_offset": 0, "end_offset": 5 }, ...] Sequence to sequence [{ "text": "Cat" }, ...]
-
点击 Next ,配置标签映射(Configure label mappings),
From
填写上面result解析出来的结果,To
选择对应Doccano项目里设置的标签: -
再次点击测试,正确后点击Finish:
-
标注时打开Auto Labeling即可
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧