《数据标注工程》第三章学习笔记及作业:数据标注分类(转)
《数据标注工程》第三章学习笔记及作业:数据标注分类
第三章:数据标注分类
一、图像标注
1、什么是图像标注
图像标注可能是最广泛、最普遍的一种数据标注形式。图像标注问题的本质是视觉到语言的问题,需要在两种不同形式的图像信息到文本信息之间进行“翻译”。
2、图像标注应用领域
①、车辆车牌标注
- 拉框标注:使用与车辆边缘相切的矩形框,然后注明每个框的属性
- 切割标注:标注范围完全与车辆边缘重合,然后注明每个框的属性
②、人像识别标注
- 人脸关键点标注:每个点对应一个特征位置,特征点数量从基础5点到较多的240点,包含人的脸部轮廓、唇形轮廓、鼻型轮廓、眼轮廓、眉轮廓等,形成一张完整的人脸关键点位分布图
③、医疗影像标注
- 发展不成熟,进入门槛高,要求极高,标注错误会出医疗事故,只有医学领域的专业人才可以进行标注工作
④、机械影像标注
- 尺寸标注:明确基本要求、国家标准与相关规范,标注后再检查,确保完整性和正确性
- 表面粗糙度标注:分析国家标准对粗糙度的要求,从表面粗糙度符号的回执、标注位置和方向以及表面粗糙度数值的注写出发
二、语音标注
1、什么是语音标注
将“说出的话”所对应的“文字”标记出来,并一点点去修正语音和文字间的误差
2、客服录音数据标注规范
- 文字错误率:指语音内容方面的标注错误,一个字错了,一条语音就算错,一般要控制在3%以内。
- 其他错误率:指除了语音内容以外的其他标注错误,一项错了,一条语音就算错,一般控制在5%以内。
客服录音数据标注规范的6个步骤
文字转写的要求:
- 汉字不能有错别字,人名等无法确定的字可用同音字表示。
- 保证一致性,不能自行删减重复字或修改不通顺,但可以修改平翘舌或后鼻音等造成的发音改变。
- 网络用语等特殊名词应保持一致,不能随意修改为书面用语。
- 数字不能出现阿拉伯形式。
- 儿化音应予以准确标记。
- 语气词应予以准确标记。
- 夹杂的英文按以下方式处理:①、拼读形式的字母,应以大写字母形式去标注每一个拼出的字母,并在字母之间加空格。②、英文单词或短语,若可以准确确定英文内容,则可以正常标注,其他情况下直接抛弃,标注工作主要针对中文普通话,因此除了常见专有词汇以外可直接抛弃。
三、文本标注
1、什么是文本标注
将文字、符号在内的文本进行标注,让计算机能够读懂识别,从而应用于人类的生产生活领域。
2、文本标注应用领域
①、应用行业
- 客服行业:主要集中在场景识别和应答识别。
- 金融行业:主要是线上平台标注和线下表格标注。
- 医疗行业:标注对象是一些病历字段,进行词属性拆分。
②、应用类型:主要有数据清洗、语义识别、实体识别、场景识别、情绪识别、应答识别
四、本章知识点框架
五、作业及练习
1、数据标注的分类有哪些?请简要概括。
答:按标注对象分主要分为图像标注、语音标注、文本标注。
2、你怎样理解图像标注的概念?
答:图像标注问题的本质是视觉到语言的问题,将图像信息翻译为文本信息后交由算法处理,以便让算法能够根据图像得出描述其内容含义的自然语句和自然语言。
3、图像标注有哪些具体应用?
答:例如车辆车牌标注、人像识别标注、医疗影像标注、机械影像标注等。
4、你怎样理解语音标注的概念?
答:人们谈话交流是生活中很常见的场景,因此语音标注与我们生活的众多方面息息相关,我们需要标记这些人们“说出的话”所对应的“文字”,以便机器处理,这就是语音标注。
5、语音标注的规范有哪些?请详细论述。
答:①、确定是否包含有效语音:例如无声语音、噪音过大听不清、方言过重听不懂、无意义内容等都属于无效语音。
②、确定语音的噪声情况:例如其他人的谈话声、咳嗽声、雨声、动物叫声、背景音乐、车鸣声、电流声等。
③、确定说话人数量:即标注出语音内容是由几个人说出来的,例如客服录音一般都是两个人。
④、确定说话人性别:若有多人则标注出第一个说话人的性别。
⑤、确定是否包含口音:例如方言、平翘舌、后鼻音等。
⑥、语音内容方面:转写的文字以主体说话人声音较大的为标准,并用特殊符号记录听不清或难以区分的部分。
6、你怎样理解文本标注的概念?
答:文本标注是最常见的数据标注类型之一,是指将文字、符号在内的文本进行标注,让计算机能够读懂识别,从而应用于人类的生产生活领域。
7、文本标注有哪些具体应用?
答:例如客服行业的场景识别和应答识别;金融行业的线上平台标注和线下表格标注;医疗行业的病历句段标注等。