基于AC-SE-ResNeXt卷积神经网络的人脸关键点检测算法研究
近些年,随着计算机算力的快速提升和深度学习算法研究的不断深入,人脸关键点检测算法也得到了长足的发展,由于在人脸表情识别、人脸追踪、身份验证等场景有着重要的应用,因此在计算机视觉领域中一直都是被关注的焦点和研究的热点。在现有的经典人脸关键点检测算法中,基于级联回归使用卷积神经网络作为回归器的策略是一个重要分支,但是该策略有较高精度的同时还存在着以下不足之处:(1)由于采用级联回归的思想,从粗到精逐步得到精确的关键点位置,因此需要多阶段回归。(2)为了缩小下一阶段的输入尺寸同时减少输入数据所带来的噪声影响,相邻阶段间需要对输入数据进行预处理。(3)算法流程结构相当地复杂,这导致了这些算法无论是初始训练阶段还是应用阶段都相当地繁琐。针对以上问题,本文在残差网络基础上引入注意力机制,构建出一种全新的网络结构,在达到级联算法精度的同时只使用一个端到端网络便完成了人脸关键点检测任务。本文的主要创新点如下:1、以聚合残差变换网络(Aggregated Residual Transformations for Deep Neural Networks,ResNeXt)为基础框架,通过重构网络结构,引入注意力机制。其中,用非对称卷积(Asymmetric Convolution,AC)结构构建空间注意力模块,用压缩激发(Squeeze Excitation,SE)结构构建通道注意力模块,通过强化网络空间学习能力和特征映射的通道相关性,设计并构建了串行和并行非对称卷积-压缩激发ResNeXt(Asymmetric Convolution-Squeeze Excitation ResNeXt,AC-SE-ResNeXt)网络模型。2、上述通过AC结构和SE结构添加了空间注意力机制和通道注意力机制的AC-SE-ResNeXt网络模型,可实现端到端的人脸关键点检测,在单阶段只使用一个网络的情况下,不仅避免了级联策略中多阶段回归的算法流程复杂性,还解决了相邻阶段间数据需要进行预处理的问题。3、对训练好的模型分别在数据集BioID和LFPW上进行测试,其中在BioID数据集上人脸五点关键点检测的综合平均误差率为1.99%;在LFPW数据集上人脸五点关键点检测的平均误差率为2.3%。实验结果表明,与级联算法相比,在简化算法流程结构并能进行端到端处理的同时保持了相当的精度,且鲁棒性得到了明显的提升。
- 作者:
- 王贺兵
- 学位授予单位:
- 北方民族大学
- 专业名称:
- 计算机软件与理论
- 授予学位:
- 硕士
- 学位年度:
- 2021年
- 导师姓名:
- 张春梅
- 中图分类号:
- TP391.41;TP183
- 关键词:
- 人脸关键点检测;残差网络;注意力机制;非对称卷积;压缩激发模块
-