摘要:
使用场景: 科研中批量处理数据时的,文件路径分割以及文件格式判断。 对于文件格式判断,是因为实际文件的格式多种多样,就拿图像为例,就有.png .jpg .bmp等等。 更不用说,有时候还有一些干扰文件需要屏蔽(比如Mac系统的.DS_Store文件)。 这就需要我们判断文件格式,再对特定格式的文件 阅读全文
摘要:
使用场景: 在科研中,数据样本的命名方式往往包含着对应的信息, 例如,一张人脸图片 34_anger_1.png,文件名中包含着该图片中主体在数据集中的ID、人脸表情种类、以及该图片是同类型第几张图片。 使用python批量处理数据时,从文件名中获取对应信息也是很关键的一步,然后才能基于这些信息进行 阅读全文
摘要:
使用场景: 在科研中,用Python处理数据的一个核心目的是批量处理, 批量处理节省了研究者大量的时间和精力,不然,还不如手动一个个地去处理。 批量处理通常要求数据整体较为规整,能够进行统一的处理操作, 但实际数据中总存在一些不规则的样本,甚至有些样本的命名都存在不规范, 例如,整个数据集命名都用下 阅读全文