loading

TGW专业从事停车管理系统设计和解决方案

人脸识别的发展 _ 太格网科技

自动人脸识别的经典过程分为三个步骤: 人脸检测、人脸特征点定位 (又称人脸对齐) 、特征提取和分类器设计。 一般来说,狭义的人脸识别是指 & quot; 特征提取分类器 & quot; 算法研究的两个部分。 在深度学习出现之前,人脸识别方法一般分为高维人工特征提取 (如LBP、Gabor等) 和降维两步。 代表性的降维方法包括PCA和LDA等子空间学习方法和LPP等流行学习方法。 深度学习方法普及后,代表性的方法是从原始图像空间直接学习判别人脸表示。 一般来说,人脸识别的研究历史可以分为三个阶段。 在第一阶段 (1950年代-1980年代),人脸识别被视为一般的模式识别问题。 主流技术基于面部的几何结构。 在第二阶段 (20世纪90年代),人脸识别迅速发展,出现了许多经典方法,例如特征脸,Fisher人脸和弹性图匹配。 此时,主流技术路线是面向表观建模。 在第三阶段 (从20世纪90年代结束到现在),关于人脸识别的研究不断深入。 研究人员开始关注人脸识别面对真实状况,主要包括以下四个方面: 1) 提出不同的人脸空间模型,包括以线性判别分析为代表的线性建模方法、以核为代表的非线性建模方法和基于三维信息的三维人脸识别方法。 2) 深入分析和研究影响人脸识别的因素,包括光照不变人脸识别、姿态不变人脸识别和表情不变人脸识别。 3) 使用了新的特征表示,包括局部描述符 (Gabor face,LBP face等) 和深度学习方法。 4) 使用新的数据源,例如基于视频的人脸识别和基于草图和近红外图像的人脸识别。 自2007年以来,LFW数据库已成为真实条件下人脸识别的测试基准。 LFW数据集包括来自互联网的5749人的13233人脸图像,其中1680人具有两个或更多个图像。 LFW的标准测试协议包括6000对脸的十倍确认任务。 每个折叠包括300对正实例和300对负实例。 十倍平均精度作为绩效评价指标。 自LFW发布以来,性能不断刷新。 在2013之前,主要的技术路线是人工或基于学习的局部描述符测量学习。 经过2014,主要的技术路线是深入学习。 自2014年以来,深度学习大数据 (海量标注人脸数据) 已成为人脸识别领域的主流技术路线。 两个重要的趋势是: 1) 网络变得越来越大,越来越深 (vggface16层,facenet22层)。 2) 随着数据量的增加 (deepface 400万,facenet 2亿),大数据已成为提高人脸识别性能的关键。 在前DL时代,以vipl实验室的第三代半SDK为例,关键技术点包括1) 块面特征融合: Gabor特征LPQ特征。 2) 用于特征约简的子空间学习 (PCA LDA)。 3) 融合多尺度人脸归一化模板。 在FRGC实验4中,sdk3.5的相关技术在错误接受率0.1% 的情况下达到了96% 的确认率,这仍然是FRGC数据集中最好的结果。 需要说明的是,虽然深度学习强调的是特征学习,但是学习特征并不是DL的专利。 在前DL时代,使用浅层模型直接从图像中学习表示以及基于人工描述符学习语义表示的工作 (例如用于学习中层属性表示的属性和simile分类器以及用于学习高级语义表示的Tom vs Pete) 在相关文献中可以看到。 2014年,Facebook发表了其在cvpr14上的工作。 Deepface将大数据 (400万人脸数据) 与深度卷积网络相结合,在LFW数据集上接近人类识别的准确性。 Deepface还引入了局部连接的卷积结构,以在每个空间位置学习单独的卷积内核。 缺点是会导致参数膨胀。 这种结构后来没有流行起来。 Deepid家族可以看作是DL时代人脸识别领域的一组代表性作品。 最早的deepid网络包括四个卷积层,并采用softmax损失函数。 Deepid2在deepid2网络的基础上同时考虑身份丢失和验证丢失。 这两个损失可以通过在Caffe深度学习框架中分别使用softmaxwithlos层和对比度损失层来实现。 Deepid2网络在deepid2的基础上增加了各层的辅助损失函数 (类似于深度监督网络)。 Google于cvpr2015发表作品。 Facenet使用22层深度卷积网络和海量人脸数据 (800万人的2亿图像) 以及图像检索任务中常用的三重损失函数。 值得一提的是,由于人脸类别数达到800万,如果使用softmax loss,输出层节点数将达到800万,并且至少需要32GB的视频内存 (假设最后一个隐藏层节点有1024,使用单精度浮点数) 但是,三重态丢失不需要占用额外的视频存储器。 Facenet在LFW数据集上10% 折扣的平均准确率达到了99.63%,这也是迄今为止正式发表论文中最好的成绩,几乎宣告了LFW 2008年2015年上长达8年的性能竞赛的结束。

人脸识别的发展 _ 太格网科技 1

请与我们联系
推荐的文章
案例
没有数据
深圳市虎王科技有限公司是领先的车辆智能停车系统、车牌识别系统、行人门禁闸机、人脸识别终端等门禁解决方案提供商。 LPR停车解决方案 .
没有数据
CONTACT US

深圳市泰格旺科技有限公司

电话:86 13717037584

电子邮件: info@sztigerwong.com

地址:硅谷动力数字产业园A2栋一楼 龙华区观澜街道大富路22号

中国广东省深圳市  

                    

版权©2021深圳市TigerWong科技有限公司  | 网站地图
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
取消
Customer service
detect