“人脸识别”是人工智能的一个重要应用,听起来技术含量很高,貌似非常复杂,具体的实现也的确非常复杂,目前的算法一般都基于深度学习神经网络。但如果仅仅是使用识别功能,目前已有封装好的功能模块,并不需要训练模型,甚至不需要了解任何算法原理,只需调用Python的三方模块,几行代码即可实现人脸识别。
face_recognition是目前使用方法最简单,效果也非常好的人脸识别库,它的离线识别率高达99.38%。除了检测面部位置,它还能快速识别出面部特征:如眉毛、眼睛、鼻子、嘴,识别具体的人,对比两张脸的相似度等等。从后面例程可以看到,识别位置相当准确。
一、安装和原理
face_recognition底层基于dlib实现。dlib是一个人脸关键点检测库,它的核心功能由C++实现,适用于多个平台。不同于一般的Python三方模块,它在安装时需要编译,其Github上主要介绍了它在Linux和MacOS系统的安装方法。在Windows系统下编译安装过程比较复杂,需要安装Visual Studio的 Visual C++ for Linux环境,相关工具几十个G,安装步骤和注意事项也很多,因此还是建议使用Linux系统(尽管这可能让一些读者望而却步)。
在Linux下安装方法非常简单:
$ pip install face_recognition
Linux将自动安装face_recognition及其依赖的三方工具集。同时,建议下载源码:
$ git clone https://github.com/davisking/dlib.git
$ git clone https://github.com/ageitgey/face_recognition_models
$ git clone https://github.com/ageitgey/face_recognition
下载源码主要为了通过其示例学习三方模块的使用方法,以及了解底层调用的库和具体的实现方法,以及相关的文档。
dlib模块实现最核心的功能——人脸关键点检测,从源码中可以看到,它主要由C++语言实现,并提供了C++和Python接口,因此,可以在不同环境下开发和使用,目前也有开发者将其移植到android手机上。
face_recognition_models存储了训练好的模型,供face_recognition模块调用,模型的扩展名为“.dat”。
face_recognition模块的功能代码并不多,主要是封装了dlib,简化了开发者的调用步骤。其example中有很多有趣的例程,比如:虚化人脸(类似于马赛克效果),化妆,追踪视频中的人脸,甚至还启动WebService,识别用户上传的图片;还包括与机器学习模型KNN,SVM结合使用的例程,其原理也是用dlib提取人脸特征,再加入机器学习模型训练,根据需求,生成新的模型。可将其看作图像识别在人脸识别垂直领域的细化和封装。
dlib的使用方法并不复杂,而face_recognition则更加简单,face_recognition还提供了直接运行的两个工具:人脸检测face_dection和人脸识别face_recognition。
二、face_recognition例程
本例程调用face_recognition模块,实现了人脸识别,画眉、画眼线和涂口线的功能。
from PIL import Image, ImageDraw
import face_recognition
image = face_recognition.load_image_file("face2.png")
face_landmarks_list = face_recognition.face_landmarks(image)
for face_landmarks in face_landmarks_list:
color = [238,42,68]
pil_image = Image.fromarray(image)
d = ImageDraw.Draw(pil_image, 'RGBA')
print(face_landmarks.keys())
d.polygon(face_landmarks['left_eyebrow'], fill=(68, 54, 39, 50))
d.polygon(face_landmarks['right_eyebrow'], fill=(68, 54, 39, 50))
d.polygon(face_landmarks['top_lip'], fill=(color[0], color[1], color[2], 80))
d.polygon(face_landmarks['bottom_lip'], fill=(color[0], color[1], color[2], 80))
d.line(face_landmarks['left_eye'] + [face_landmarks['left_eye'][0]], fill=(0, 0, 0, 50), width=3)
d.line(face_landmarks['right_eye'] + [face_landmarks['right_eye'][0]], fill=(0, 0, 0, 50), width=3)
pil_image.show()
pil_image.save('out4.png')
三、dlib例程
本例程直接调用dlib模块,使用face_recognition_models中训练好的模型,识别人脸上的68个特征点。
import dlib
import cv2
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor('/exports/git/face_recognition_models/face_recognition_models/models/shape_predictor_68_face_landmarks.dat')
img = cv2.imread("/tmp/face2.png")
dets = detector(img, 1)
for k, d in enumerate(dets):
print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format(
k, d.left(), d.top(), d.right(), d.bottom()))
shape = predictor(img, d)
for index, pt in enumerate(shape.parts()):
print('Part {}: {}'.format(index, pt))
pt_pos = (pt.x, pt.y)
cv2.circle(img, pt_pos, 1, (255, 0, 0), 2)
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(img, str(index+1),pt_pos,font, 0.3, (0, 0, 255), 1, cv2.LINE_AA)
cv2.imshow('img', img)
k = cv2.waitKey()
cv2.destroyAllWindows()
四、总结
对于大多数的Python程序,开发者需要的90%功能三方模块都已经实现完成,很多功能都已非常成熟,剩余的10%由开发者根据需求进行适配即可完成。这使得开发者在短时间内即可实现基本功能,并且看起来非常强大,但是后期效果提升比较困难。
个人觉得:人脸识别工具真的很适合美妆卖家,买家上传一张相片,合成各种色号的效果;在视频通话过程中察言观色;图片识别,刷脸支付,美颜相机;稍加一些艺术处理,自动生成漫画等等。