loading

Développement de la reconnaissance faciale_ Technologie Taigewang

Le processus classique de reconnaissance automatique des visages est divisé en trois étapes : la détection des visages, la localisation des points des caractéristiques du visage (également appelée alignement des visages), l'extraction des caractéristiques et la conception du classificateur. D'une manière générale, la reconnaissance faciale au sens étroit fait référence à & quot ; Classificateur d'extraction de caractéristiques & quot ; Deux volets de la recherche algorithmique. Avant l'émergence de l'apprentissage en profondeur, les méthodes de reconnaissance faciale étaient généralement divisées en deux étapes : l'extraction de caractéristiques artificielles de haute dimension (telles que LBP, Gabor, etc.) et la réduction de dimension. Les méthodes de réduction de dimension représentatives comprennent des méthodes d'apprentissage de sous-espace telles que PCA et LDA et des méthodes d'apprentissage populaires telles que LPP. Après la popularité des méthodes d'apprentissage en profondeur, la méthode représentative consiste à apprendre directement la représentation du visage discriminant à partir de l'espace image d'origine. D'une manière générale, l'histoire de la recherche sur la reconnaissance faciale peut être divisée en trois étapes. Dans la première étape (années 1950-1980), la reconnaissance faciale était considérée comme un problème général de reconnaissance de formes. La technologie dominante était basée sur la structure géométrique du visage. Dans la deuxième étape (années 1990), la reconnaissance faciale s'est développée rapidement et de nombreuses méthodes classiques sont apparues, telles que l'eigenface, le visage de Fisher et l'appariement de graphes élastiques. A cette époque, la voie technique dominante est face à la modélisation apparente. Dans la troisième étape (de la fin des années 1990 à nos jours), les recherches sur la reconnaissance faciale se sont approfondies. Les chercheurs ont commencé à s'intéresser à la reconnaissance faciale face à des conditions réelles, comprenant principalement les quatre aspects suivants : 1) proposer différents modèles d'espace facial, y compris des méthodes de modélisation linéaire représentées par une analyse discriminante linéaire, une méthode de modélisation non linéaire représentée par la méthode du noyau et une méthode de reconnaissance faciale 3D basée sur sur les informations 3D. 2) Analyser et étudier en profondeur les facteurs affectant la reconnaissance faciale, y compris la reconnaissance faciale invariante d'éclairage, la reconnaissance faciale invariante de pose et la reconnaissance faciale invariante d'expression. 3) De nouvelles représentations de caractéristiques sont utilisées, y compris des descripteurs locaux (visage Gabor, visage LBP, etc.) et des méthodes d'apprentissage en profondeur. 4) Utilisation de nouvelles sources de données, telles que la reconnaissance faciale basée sur la vidéo et la reconnaissance faciale basée sur des croquis et des images infrarouges proches. Depuis 2007, la base de données LFW est devenue la référence des tests de reconnaissance faciale en conditions réelles. L'ensemble de données LFW comprend 13233 images de visage de 5749 personnes sur Internet, dont 1680 personnes ont deux images ou plus. Le protocole de test standard de LFW comprend la tâche de confirmation décuplée de 6000 paires de visages. Chaque pli comprend 300 paires d'exemples positifs et 300 paires d'exemples négatifs. La précision moyenne multipliée par dix est utilisée comme indice d'évaluation des performances. Depuis la sortie de LFW, les performances ont été constamment actualisées. Avant 2013, la principale voie technique était l'apprentissage artificiel ou basé sur l'apprentissage de la mesure des descripteurs locaux. Après 2014, la voie technique principale est l'apprentissage approfondi. Depuis 2014, le deep learning big data (données faciales étiquetées massives) est devenu la voie technique dominante dans le domaine de la reconnaissance faciale. Deux tendances importantes sont : 1) le réseau devient plus grand et plus profond (couche vggface16, couche facenet22). 2) Avec la quantité croissante de données (deepface 4 millions, facenet 200 millions), le big data est devenu la clé pour améliorer les performances de la reconnaissance faciale. Dans l'ère pré DL, en prenant comme exemple la troisième génération et la moitié du SDK du laboratoire vipl, les points techniques clés incluent 1) la fusion des fonctionnalités de face de bloc : la fonctionnalité Gabor LPQ. 2) Apprentissage de sous-espace pour la réduction de fonctionnalités (PCA LDA). 3) Fusion d'un modèle de normalisation de visage multi-échelles. Les technologies associées de sdk3.5 ont atteint un taux de confirmation de 96 % sous la condition d'un taux d'acceptation des erreurs de 0,1 % dans l'expérience FRGC 4, ce qui reste le meilleur résultat dans l'ensemble de données FRGC. Il convient de noter que bien que l'apprentissage en profondeur mette l'accent sur l'apprentissage des fonctionnalités, l'apprentissage des fonctionnalités n'est pas le brevet de DL. À l'ère pré-DL, le travail d'apprentissage direct de la représentation à partir d'images à l'aide de modèles superficiels et de l'apprentissage de la représentation sémantique basée sur des descripteurs artificiels (tels que les attributs et le classificateur de comparaison pour l'apprentissage de la représentation d'attributs de niveau intermédiaire et Tom vs Pete pour l'apprentissage de la représentation sémantique de haut niveau ) sont vus dans la littérature pertinente. En 2014, Facebook a publié ses travaux sur cvpr14. Deepface a combiné des données volumineuses (4 millions de données faciales) avec un réseau à convolution profonde, qui s'est approché de la précision de la reconnaissance humaine sur l'ensemble de données LFW. Deepface introduit également une structure de convolution connectée locale pour apprendre un noyau de convolution séparé à chaque position spatiale. L'inconvénient est que cela conduira à une expansion des paramètres. Cette structure n'est pas devenue populaire plus tard. La famille Deepid peut être considérée comme un groupe de travail représentatif dans le domaine de la reconnaissance faciale à l'ère DL. Le premier réseau deepid comprenait quatre couches de convolution et adoptait la fonction de perte softmax. Deepid2 considère à la fois la perte d'identité et la perte de vérification sur la base du réseau deepid2. Ces deux pertes peuvent être réalisées en utilisant respectivement la couche softmaxwithlos et la couche de perte de contraste dans le cadre d'apprentissage en profondeur Caffe. Le réseau Deepid2 ajoute une fonction de perte auxiliaire de chaque couche sur la base de deepid2 (similaire au réseau supervisé profond). Google a publié son travail dans cvpr2015. Facenet utilise 22 couches de réseau à convolution profonde et des données faciales massives (200 millions d'images de 8 millions de personnes) et la fonction de triple perte couramment utilisée dans les tâches de récupération d'images. Il convient de mentionner que, puisque le nombre de catégories de visage atteint 8 millions, si la perte softmax est utilisée, le nombre de nœuds de couche de sortie atteindra 8 millions et au moins 32 Go de mémoire vidéo sont nécessaires (en supposant que le dernier nœud de couche caché a 1024, en utilisant des nombres à virgule flottante simple précision) Cependant, la perte de triplet n'a pas besoin d'occuper de mémoire vidéo supplémentaire. La précision moyenne de Facenet de 10 % de remise sur l'ensemble de données LFW atteint 99,63 %, ce qui est également le meilleur résultat dans les articles publiés officiellement à ce jour, annonçant presque la fin du concours de performance de huit ans sur LFW de 2008 à 2015.

Développement de la reconnaissance faciale_ Technologie Taigewang 1

Prenez contact avec nous
Articles recommandés
Cas
Trouvez le manuel ultime sur les solutions de stationnement LPR efficaces fourni par Shenzhen TigerWong Technology Co., Ltd. Notre guide complet offre un aperçu de la technologie de pointe et explore des stratégies de réduction des coûts afin que les acheteurs puissent prendre des décisions éclairées. Faites-nous confiance pour répondre à tous vos besoins de stationnement LPR !
L'introduction des solutions de stationnement LPR Nous allons devoir examiner des problèmes très complexes lorsque nous en viendrons à écrire beaucoup de choses que les gens doivent comprendre
L'introduction des solutions de stationnement LPR Les systèmes de stationnement LPR sont maintenant installés dans toutes sortes de voitures et de camions légers. Ils ont été installés dans une variété d'industries
L'introduction des solutions de stationnement lprUn paragraphe pour un blog intitulé « L'introduction des solutions de stationnement lpr » où la section se concentre sur « L'introduction de
Quels sont les facteurs importants à prendre en compte avant d'acheter des solutions de stationnement lpr ? J'achète des équipements de stationnement pour mon bureau depuis un certain temps maintenant. Le seul
Introduction aux solutions de stationnement lpr La plupart du temps, lorsqu'une personne a besoin d'utiliser plus d'un bouton sur un appareil, elle choisira d'utiliser le plus couramment utilisé
Qu'est-ce que les solutions de stationnement lpr ? La plupart du temps, les gens ne savent pas ce qu'ils recherchent dans un système de stationnement. Souvent, ils se garent juste au même endroit et h
L'introduction des solutions de stationnement lprLe parking et la machine de stationnement sont le seul moyen d'éliminer la saleté et les feuilles de la voiture. En installant une borne ou un smart
L'introduction des solutions de stationnement lpr L'invention du monde moderne est très ancienne. L'histoire de la technologie et du progrès a été longue et variée. Il a vu adva
L'introduction des solutions de stationnement LPR Les systèmes de stationnement LPR sont conçus pour améliorer la qualité de vie des personnes qui utilisent les transports en commun. Le seul problème
pas de données
Shenzhen Tiger Wong Technology Co., Ltd est le principal fournisseur de solutions de contrôle d'accès pour le système de stationnement intelligent des véhicules, le système de reconnaissance de plaque d'immatriculation, le tourniquet de contrôle d'accès des piétons, les terminaux de reconnaissance faciale et Solutions de stationnement LPR .
pas de données
CONTACT US

Technologie Cie., Ltd de Shenzhen TigerWong

Tel:86 13717037584

E-mail: info@sztigerwong.com

Ajouter : 1er étage, bâtiment A2, parc industriel numérique de Silicon Valley Power, No. 22 route Dafu, rue Guanlan, district de Longhua,

Shenzhen, province du Guangdong, Chine  

                    

Droit d'auteur©Shenzhen TigerWong Technology Co.,Ltd 2021  | Plan du site
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
Annuler
Customer service
detect