人脸对齐系列总结(二) --- 人脸关键点检测综述

人脸关键点检测简介

人脸关键点检测也叫人脸对齐，英文名facial landmark, face alignment. 定位人脸的眉毛、眼睛、鼻子、嘴巴、人脸轮廓等。不同的数据集有不同的标记点个数，最少的标记5个关键点(两只眼睛瞳孔中心，鼻尖，左右嘴角)，常见的有68个关键点，也有上百个关键点的。人脸关键点大多是在人脸检测的基础上进行的，首先要用face detection方法检测出人脸区域，在人脸区域上进行关键点定位。

任务难点

人脸姿态(pose)变化
部分遮挡(occlusion)
表情(expression)变化
光照(illumination)影响

68个关键点标记图

数据集
下图数据集整理参考计算机学报人脸特征点提取方法综述

另外还有CelebA数据集，共有20多万张图片，但是只标记了5个关键点。

论文整理

论文方法分类

分类方法仅限于个人理解，欢迎各位大佬指正

点分布模型(Point Distribution Model)
点分布模型是用多个关键点来描述形状，描述形状的平均几何形状，属于数学统计模型。经典的AAM(Active Appearance Model)和ASM(Active Shape Model)，都属于点分布模型。比如手的形状，可以用多个点连接起来表示，人的手都有5根手指(这是共同点)，但不同的人手指形状略有不同(这是不同点)，假设收集了大量的人的手的图片，并标记了每张图片的关键点(假设如下图所示)，那么对所有样本取平均，就可以得到平均形状，这样每个人的手形就可以表示为平均手形+差异形状。人脸关键点也类似。

点分布模型的具体步骤是(参考ASM（Active Shape Model）算法介绍)：
- 构建训练集的形状向量，用Procruses方法进行归一化(消除人脸由于不同角度、远近距离、姿态变化等造成的干扰)
- 计算平均形状，将所有形状对齐到平均形状直到收敛
- 将对齐后的形状向量进行PCA处理
- 为每个特征点构建局部特征
级联形状回归(Cascade Shape Regression)
级联形状回归是用多个弱学习器对形状进行回归，每个弱学习器在前一个学习器预测的形状基础上进行回归，一步一步收敛得到最终形状，是由粗到细的过程。根据特征提取的不同，可以分为以下两种
- 基于非深度特征提取方法的级联形状回归
- 基于深度学习提取特征的级联形状回归
多任务学习(Multi-taks)
人脸关键点检测一般是基于人脸检测的基础上，也就是说常见的关键点检测方法默认是已经检测出了人脸区域的。多任务学习是指模型不仅能检测人脸关键点，还能检测人脸，甚至还能检测性别、头部姿势(头往左偏、往右偏)等。多任务模型的训练一般分为几个步骤，先训练出人脸检测模型，在人脸检测模型的基础上进行头部姿势检测，根据头部姿势进行矫正(比如统一头朝左等)，然后进行人脸关键点检测。实验证明，多任务学习效果较好，因为多个子任务是相互关联的，多个任务同时学习能提高模型的学习能力。

点分布模型(Point Distribution Model)相关论文

[1995] Active Shape Models-Their Training and Application
[2001] Active Appearance Models
[2004-IJCV] Active Appearance Models Revisited
[2006-BMVC] Feature Detection and Tracking with Constrained Local Models
[2011-IJCV] Deformable Model Fitting by Regularized Landmark Mean-Shift

级联形状回归(Cascade Shape Regression)相关论文

非深度特征
- [2013 ICCV] PCPR- Robust face landmark estimation under occlusion
- [2014(有源码)-IJCV] Face Alignment by Explicit Shape Regression
- [2014(有源码)-CVPR] Face Alignment at 3000 FPS via Regressing Local Binary Features
深度学习
- [2013-CVPR] Deep Convolutional Network Cascade for Facial Point Detection
- [2017-CVPR]A Deep Regression Architecture with Two-Stage Re-initialization for High Performance Facial Landmark Detection
- [code(有源码)-2018-CVPR] Look at Boundary- A Boundary-Aware Face Alignment Algorithm
- [code(有源码)-2017_ICCV]How far are we from solving the 2D & 3D Face Alignment problem_ (and a dataset of 230,000 3D facial landmarks)
- [code(有源码)-2017_CVPR] Deep Alignment Network A convolutional neural network for robust face

多任务学习(Multi-taks)相关论文

[2014_ECCV] Facial landmark detection by deep multi-task learning
[2016(有源码)] Joint Face Detection and Alignment using multi-task cascaded convolutional networks

另一种分类方式，参考论文《Look at Boundary-Aware Face Alignment Algorithm》，根据坐标点的预测方式分为：

坐标回归模型(Coordinate regression models)
直接预测关键点的坐标
热力图回归模型(Heatmap regression models)
对输入图片的每个像素计算可能是某个关键点的概率，选取概率最高的像素坐标作为关键点坐标。如果有k个关键点，则最后输出k个Heatmap(heatmap是一个二维矩阵，大小和输入图片保持一致)，取每个Heatmap概率最高的像素坐标。

热力图回归模型(Heatmap regression models)相关论文

[code(有源码)-2018-CVPR] Look at Boundary- A Boundary-Aware Face Alignment Algorithm
[code(有源码)-2017_ICCV] How far are we from solving the 2D & 3D Face Alignment problem_ (and a dataset of 230,000 3D facial landmarks)
[2017-CVPR] Stacked Hourglass Network for Robust Facial Landmark Localisation