人脸年龄数据集收集

 


好文推荐:https://zhuanlan.zhihu.com/p/471844156

1. StyleGAN 生成人脸数据

http://www.seeprettyface.com/mydataset.html#dataset1

2. kaggle 男女的数据集 应该没有小孩

https://www.kaggle.com/datasets/cashutosh/gender-classification-dataset?select=Validation

3. 简单介绍


3.1 UTKFace

Description

over 20,000 face images with annotations of age, gender, and ethnicity(种族). The images cover large variation in pose, facial expression(表情), illumination(光照), occlusion(遮挡), resolution, etc.

Links

Key features

age, gender, and ethnicity


3.2 SCUT-FBP5500

5500 frontal(正面) faces with diverse(不同) properties (male/female, Asian/Caucasian(白种人;高加索人), ages) and diverse labels (facial landmarks, beauty scores in 5 scales, beauty score distribution), which allows different computational model with different facial beauty prediction paradigms(模型), such as appearance(外观)-based/shape-based facial beauty classification/regression/ranking model for male/female of Asian/Caucasian.

Links

Key features

properties (male/female, Asian/Caucasian(白种人;高加索人), ages) and diverse labels (facial landmarks, beauty scores in 5 scales, beauty score distribution)


3.3 CelebA

Description

CelebA是 CelebFaces Attribute 的缩写,意即名人人脸属性数据集,其包含10,177个名人身份的202,599张人脸图片。训练集(162770 张图像)验证集(19867 张图像)测试集(19 962)

标注了40个属性,第21个属性为性别,我没有发现有年龄,只有一个是不是年轻人

10,177 number of identities(身份,其实就是不同的人), 202,599 number of face images, and 5 landmark locations, 40 binary attributes annotations per image.

点击查看代码
5_o_Clock_Shadow:刚长出的双颊胡须
Arched_Eyebrows:柳叶眉
Attractive:吸引人的
Bags_Under_Eyes:眼袋
Bald:秃头
Bangs:刘海
Big_Lips:大嘴唇
Big_Nose:大鼻子
Black_Hair:黑发
Blond_Hair:金发
Blurry:模糊的
Brown_Hair:棕发
Bushy_Eyebrows:浓眉
Chubby:圆胖的
Double_Chin:双下巴
Eyeglasses:眼镜
Goatee:山羊胡子
Gray_Hair:灰发或白发
Heavy_Makeup:浓妆
High_Cheekbones:高颧骨
Male:男性
Mouth_Slightly_Open:微微张开嘴巴
Mustache:胡子,髭
Narrow_Eyes:细长的眼睛
No_Beard:无胡子
Oval_Face:椭圆形的脸
Pale_Skin:苍白的皮肤
Pointy_Nose:尖鼻子
Receding_Hairline:发际线后移
Rosy_Cheeks:红润的双颊
Sideburns:连鬓胡子
Smiling:微笑
Straight_Hair:直发
Wavy_Hair:卷发
Wearing_Earrings:戴着耳环
Wearing_Hat:戴着帽子
Wearing_Lipstick:涂了唇膏
Wearing_Necklace:戴着项链
Wearing_Necktie:戴着领带
Young:年轻人

Links

下载方法:找到一个百度的数据库:https://aistudio.baidu.com/aistudio/datasetdetail/39207

使用

wget xx

倒是也挺快。警告:list_attr_celeba.txt 文件有问题,不完整。该文件请下载官方的文件。

处理代码:将性别男女不同的挑出来放到不同的文件夹中: 21 个属性为 gender。

f = open("list_attr_celeba.txt")
newTxt = "male.txt"
newf = open(newTxt, "a+")
newNoTxt = "female.txt"
newNof = open(newNoTxt, "a+")
#跳过第一行202599
line = f.readline()
#跳过第二行属性名称
line = f.readline()
#第三行开始操作
line = f.readline()
while line:
array = line.split()
if (array[21] == "-1"): # female
new_context = array[0] + '\n'
newNof.write(new_context)
else:
new_context = array[0] + '\n'
newf.write(new_context)
line = f.readline()
lines = len(newf.readlines())
print ("There are %d lines in %s" % (lines, newTxt))
lines = len(newNof.readlines())
print ("There are %d lines in %s" % (lines, newNoTxt))
f.close()
newf.close()
newNof.close()

或者可以将 txt 转为 csv 文件,我找到了一个现成的:

https://github.com/rbnuria/celebA/blob/main/list_attr_celeba.csv
Key features

attribute & landmark

Publish Time: 2015

3.4 APPA-REAL

视觉年龄估计,7,591张带有实际年龄和视觉年龄标注的图片,分为 4113 train, 1500 valid and 1978 test images, 大小:844M.

Links

Key features

age


3.5 AFAD Dataset

Asian Face Age Dataset,more than 160K facial images and the corresponding age and gender labels.

Links

Key features

age and gender


3.6 FER+

微软重新标注的fer2013,表情识别比赛数据

Links

Key features

表情识别


3.7 NKI

GENKI数据集是由加利福尼亚大学的机器概念实验室收集。该数据集包含GENKI-R2009a,GENKI-4K,GENKI-SZSL三个部分。GENKI-R2009a包含11159个图像,GENKI-4K包含4000个图像,分为“笑”和“不笑”两种,每个图片的人脸的尺度大小,姿势,光照变化,头的转动等都不一样,专门用于做笑脸识别。GENKI-SZSL包含3500个图像,这些图像包括广泛的背景,光照条件,地理位置,个人身份和种族等

Links

Key features

笑脸识别


3.8 IMDB-WIKI

Description

100k 名最受欢迎的演员的 500k+ face images with age and gender labels

该数据集只使用第二强人脸检测值低于阈值的照片。为了使网络对所有年龄都具有同等的判断性,对训练的年龄分布进行了均衡。

Links

Key features

age & gender

Publish Time: 2015

3.9 Adience

Description

包括2,284人,共26,580张图片。

Unfiltered(未经过滤的?不懂) faces for gender and age classification

Links

Key features

age & gender

Publish Time: 2014

3.10 WFLW

Description

WFLW contains 10000 faces (7500 for training and 2500 for testing) with 98 fully manual annotated landmarks.

Links

Key features

landmarks

Publish Time: 2018

3.11 Caltech10k Web Faces

Description

The dataset has 10,524 human faces of various resolutions and in different settings

Links

Key features

landmarks

Publish Time: 2005

3.12 EmotioNet

Description

The EmotioNet database includes 950,000 images with annotated AUs. A subset of the images in the EmotioNet database correspond to basic and compound(复合的) emotions.

Links

Key features

AU and Emotion

Publish Time: 2017

3.13 RAF( Real-world Affective(情感的) Faces)

Description

29672 number of real-world images, including 7 classes of basic emotions and 12 classes of compound emotions, 5 accurate landmark locations, 37 automatic(自动的) landmark locations, race, age range and gender attributes annotations per image

Links

Key features

Emotions、landmark、race、age and gender

Publish Time: 2017

3.14 LAP

Description

大小:比赛举办了两年。分别为2476、1136、1079(train\val\test);4113、1500、1978。
标签:看起来的年龄
问题:这里的年龄是看上去的年龄(由多人打分取平均)。所以拿其他数据集上预训练好的模型直接测试的话,可能会有偏差。下载时需要先注册账号。
state-of-art:MAE=3.3

Links

Key features

age


3.15 CACD2000

Description

大小:2000名人,共163,446张图片。
标签:年龄

Links

Key features

age


3.16 MegaAge

Description

MegaAge 数据集由 41,941 个用年龄后验分布注释的人脸组成。我们还提供了仅包含亚洲人脸(40,000 张人脸图像)的 MegaAge-Asian 数据集。

Links

Key features

age


5. age and gender 可用的数据集总结

UTKFace

SCUT-FBP5500

AFAD Dataset

IMDB-WIKI

目前最大的人脸年龄数据集。
标签:年龄和性别。 实际年龄
问题:性别不平衡,女:男 = 4:1。
说明:http://www.twistedwg.com/2018/04/11/IMDB-WIKI-face_images.html

Adience

大小:包括2,284人,共26,580张图片。
标签:性别和年龄段(0-2, 4-6, 8-13, 15-20, 25-32, 38-43, 48-53, 60+) 实际年龄
问题:年龄段并不连续。
state-of-art:64%(准确分类)96%(包括分在相邻组)

RAF( Real-world Affective Faces)

LFW 数据集

下载链接:http://vis-www.cs.umass.edu/lfw/

总数: 13233
性别标注文件:http://bit.ly/lfw-gender

LFW-a

下载链接:https://talhassner.github.io/home/projects/lfwa/

lfw 的人脸对齐版本。

MSU LFW+ Database

下载链接:http://biometrics.cse.msu.edu/Publications/Databases/MSU_LFW+/

需要授权才能下载。是 LFW 数据集的扩充版,补充了 LFW 小孩的数据集。

标签:年龄、性别和种族。

数据规模:照片总数为15,699左右。

描述:适用于研究无约束环境下人脸识别的数据库。该数据先通过一些关键词(宝贝、孩子)从谷歌找到了5000张的图片,然后应用Viola-Jones[54]人脸检测器生成一组候选人脸。最后,手动删除虚假人脸检测,以及大多数似乎年龄在20岁以上的受试者。每个面部图像提供了年龄,性别和种族三种标签。

Indian Movie Face database (IMFDB)

下载链接:http://cvit.iiit.ac.in/projects/IMFDB/

标签:性别、标签和年龄等。

数据规模:由100多个视频收集的100个印度演员的34512张图像组成。

描述:印度电影人脸数据库(IMFDB)是一个大型无约束的人脸数据库,手动选择所有图像并从视频帧中裁剪,导致比例,姿势,表情,照明,年龄,分辨率,遮挡和化妆的高度可变性。IMFDB是第一个面部数据库,它根据年龄,姿势,性别,表情和遮挡类型提供每个图像的详细注释,可以帮助其他面部相关的应用程序。为了确保演员的外观多样化,电影选自5种印度语。对于每个演员,选择电影使得他们在年龄上有很大的变化。

McGillFaces Database

下载链接:https://sites.google.com/site/meltemdemirkus/mcgill-unconstrained-face-video-database/

标签:性别。

数据规模:60个视频序列的18000个640x480分辨率的视频帧。

描述:是一个视频序列数据库,用于研究视频中无约束的人脸分类问题。该数据库包含来自60个视频序列的18000个640x480分辨率的视频帧,每个视频帧记录来自不同的主题(31位女性和29位男性)。每个视频都是在不同的环境(室内或室外)中收集的,从而产生任意照明条件和背景杂乱。此外,受试者的动作完全自由,导致任意面部比例,任意面部表情,头部姿势(偏航,俯仰和滚动),运动模糊以及局部或全局遮挡。男女性别比较交均衡。

AR Face Database

下载链接:http://www2.ece.ohio-state.edu/~aleix/ARdatabase.html

标签:性别。

数据规模:126人(超过4000张彩色图片)。

描述:它包含4000多张彩色图像,对应126个人的脸(70名男性和56名女性,性别比例较均衡)。照片是在严格控制的条件下在CVC拍摄的。对参加者没有任何限制(衣服,眼镜等),化妆,发型等。

All-Age-Faces (AAF) Dataset

The All-Age-Faces (AAF) Dataset contains 13'322 face images (mostly Asian) distributed across all ages (from 2 to 80), including 7381 females and 5941 males.

This dataset can be used for age prediction and gender classification. For fair comparison, we randomly split the images into two sets, one for trainning and the other for validation. The annotation files in folder image sets have the following format: "%05dA%02d %d\n", person_id, age, gender, where for gender, 0 stands for female and 1 stands for male.

数据集说明链接:https://github.com/JingchunCheng/All-Age-Faces-Dataset

论文链接:https://ieeexplore.ieee.org/ielx7/5971803/8620941/08620951.pdf

FairFace

下载链接: https://github.com/dchen236/FairFace

谷歌链接下载失败了!!! 找到一个可用的链接:

https://aistudio.baidu.com/aistudio/datasetdetail/11313

说明:https://blog.csdn.net/LEO_Angel01/article/details/116103164

标签:Balanced Race, Gender, and Age

其他人脸数据集文档

【1】人脸处理常用数据集

【2】年龄估计系列(1)年龄性别调研:论文阅读和github资源汇总/数据库/挑战/思考

【3】人脸跨年龄数据集

...

参考链接:

【1】https://blog.csdn.net/minstyrain/article/details/82257369
【2】https://blog.csdn.net/watermelon1123/article/details/89298850
【3】https://zhuanlan.zhihu.com/p/362356480

posted @   Zenith_Hugh  阅读(606)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示

喜欢请打赏

扫描二维码打赏

微信打赏