DL之MTCNN:MTCNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
目录
MTCNN算法的简介(论文介绍)、架构详解、案例应用
MTCNN算法的架构详解
1、MTCNN的损失函数
2、MTCNN关键步骤
(1)、Proposal Net
(2)、Refine Net
(3)、Output Net
MTCNN算法的使用方法
1、案例应用
CV之FD&FA:利用MTCNN的脚本实现对LFW数据集进行FD人脸检测和FA人脸校准
MTCNN算法的简介(论文介绍)、架构详解、案例应用MTCNN是一个深度级联多任务框架。该框架用来解决由于各种姿势、照明和遮挡,在不受约束的环境中进行人脸检测和对齐的问题。
Paper地址:https://kpzhang93.github.io/MTCNN_face_detection_alignment/ github地址:https://github.com/kpzhang93/MTCNN_face_detection_alignmentmxnet版本:https://github.com/TropComplique/mtcnn-pytorchpytorch版本:https://github.com/YYuanAnyVision/mxnet_mtcnn_face_detection
MTCNN算法的架构详解网络采用三网级联结构,首先将图像重新缩放为不同大小的范围(称为图像金字塔),然后第一个模型(Proposal Network 或 P-Net)提出候选面部区域;第二个模型(Refine Network 或 R-Net)过滤边界框;第三个模型(Output Network或 O-Net)输出边界框和面部特征点位置。 CNN 三个阶段。在第一阶段,它通过浅层 CNN 快速生成候选窗口。然后,它通过更复杂的 CNN 对窗口进行细化以拒绝大量非人脸窗口。最后,它使用更强大的 CNN 来细化结果并输出面部标志位置。 模型被称为多任务网络,因为级联中的三个模型(P-Net、R-Net 和 O-Net)中的每一个都在三个任务上进行训练,例如进行三种类型的预测:人脸分类、边界框回归和人脸 landmark 定位。
1、MTCNN的损失函数针对人脸识别问题,直接使用交叉熵代价函数,对于框回归和关键点定位,使用L2损失。最后把这三部分的损失各自乘以自身的权重累加起来,形成最后的总损失。人脸识别损失函数(cross-entry loss)、回归框的损失函数 (Euclidean loss)、关键点的损失函数 (Euclidean loss)
2、MTCNN关键步骤 (1)、Proposal NetCV之FD&FA:利用MTCNN的脚本实现对LFW数据集进行FD人脸检测和FA人脸校准_一个处女座的程序猿的博客-CSDN博客