loading

Entwicklung der Gesichtserkennung_ Taigewang-Technologie

Der klassische Prozess der automatischen Gesichtserkennung ist in drei Schritte unterteilt: Gesichtserkennung, Lokalisierung von Gesichtsmerkmalspunkten (auch bekannt als Gesichtsausrichtung), Merkmalsextraktion und Klassifikatordesign. Ganz allgemein spricht man von Gesichtserkennung im engeren Sinne & Quot; Merkmalsextraktionsklassifikator & Quot; Zwei Teile der Algorithmenforschung. Vor dem Aufkommen von Deep Learning wurden Gesichtserkennungsverfahren im Allgemeinen in zwei Schritte unterteilt: hochdimensionale künstliche Merkmalsextraktion (wie LBP, Gabor usw.) und Dimensionsreduktion. Repräsentative Dimensionsreduktionsverfahren umfassen Unterraum-Lernverfahren wie PCA und LDA und beliebte Lernverfahren wie LPP. Nach der Popularität von Deep-Learning-Methoden besteht die repräsentative Methode darin, die diskriminante Gesichtsdarstellung direkt aus dem ursprünglichen Bildraum zu lernen. Generell lässt sich die Forschungsgeschichte der Gesichtserkennung in drei Etappen einteilen. In der ersten Phase (1950er-1980er Jahre) wurde die Gesichtserkennung als allgemeines Mustererkennungsproblem betrachtet. Die Mainstream-Technologie basierte auf der geometrischen Struktur des Gesichts. In der zweiten Phase (1990er Jahre) entwickelte sich die Gesichtserkennung schnell, und viele klassische Methoden tauchten auf, wie Eigenface, Fisher Face und Elastic Graph Matching. Zu diesem Zeitpunkt ist der technische Mainstream die Modellierung von Gesichtern. In der dritten Phase (seit Ende der 1990er Jahre bis heute) hat sich die Forschung zur Gesichtserkennung vertieft. Die Forscher begannen, der Gesichtserkennung unter realen Bedingungen Aufmerksamkeit zu schenken, hauptsächlich einschließlich der folgenden vier Aspekte: 1) Vorschlagen verschiedener Gesichtsraummodelle, einschließlich linearer Modellierungsmethoden, die durch lineare Diskriminanzanalyse repräsentiert werden, nichtlineare Modellierungsmethoden, repräsentiert durch Kernel-Methoden und 3D-Gesichtserkennungsmethoden basierend auf 3D-Informationen. 2) Analysieren und untersuchen Sie gründlich die Faktoren, die die Gesichtserkennung beeinflussen, einschließlich der beleuchtungsinvarianten Gesichtserkennung, der poseninvarianten Gesichtserkennung und der ausdrucksinvarianten Gesichtserkennung. 3) Neue Merkmalsdarstellungen werden verwendet, einschließlich lokaler Deskriptoren (Gabor-Gesicht, LBP-Gesicht usw.) und Deep-Learning-Methoden. 4) Nutzung neuer Datenquellen, wie Gesichtserkennung basierend auf Video und Gesichtserkennung basierend auf Skizzen- und Nahinfrarotbildern. Seit 2007 hat sich die LFW-Datenbank zum Testbenchmark für Gesichtserkennung unter realen Bedingungen entwickelt. Der LFW-Datensatz enthält 13233 Gesichtsbilder von 5749 Personen aus dem Internet, von denen 1680 Personen zwei oder mehr Bilder haben. Das Standardtestprotokoll von LFW beinhaltet die zehnfache Bestätigungsaufgabe von 6000 Gesichtspaaren. Jede Faltung enthält 300 Paar Positivbeispiele und 300 Paar Negativbeispiele. Als Leistungsbewertungsindex wird die zehnfache durchschnittliche Genauigkeit verwendet. Seit der Veröffentlichung von LFW wurde die Leistung ständig aktualisiert. Vor 2013 war der technische Hauptweg das künstliche oder lernbasierte Lernen lokaler Deskriptormaßnahmen. Nach 2014 ist der wichtigste technische Weg das vertiefte Lernen. Seit 2014 hat sich Deep Learning Big Data (Massive Labeled Face Data) zum technischen Mainstream im Bereich der Gesichtserkennung entwickelt. Zwei wichtige Trends sind: 1) Das Netzwerk wird größer und tiefer (vggface16-Layer, facenet22-Layer). 2) Mit der steigenden Datenmenge (deepface 4 Millionen, facenet 200 Millionen) ist Big Data zum Schlüssel geworden, um die Leistungsfähigkeit der Gesichtserkennung zu verbessern. In der Vor-DL-Ära, am Beispiel der dritten Generation und des halben SDK des vipl-Labors, umfassen die wichtigsten technischen Punkte 1) Block-Face-Feature-Fusion: Gabor-Feature-LPQ-Feature. 2) Unterraumlernen zur Merkmalsreduktion (PCA LDA). 3) Fusion einer Gesichtsnormalisierungsvorlage mit mehreren Maßstäben. Die verwandten Technologien von sdk3.5 erreichten eine Bestätigungsrate von 96 % unter der Bedingung einer Fehlerakzeptanzrate von 0,1 % im FRGC-Experiment 4, was immer noch das beste Ergebnis im FRGC-Datensatz ist. Es sollte beachtet werden, dass, obwohl Deep Learning das Feature-Lernen betont, das Lernen von Features nicht das Patent von DL ist. In der Vor-DL-Ära die Arbeit des direkten Erlernens der Repräsentation aus Bildern unter Verwendung flacher Modelle und des Erlernens der semantischen Repräsentation auf der Grundlage künstlicher Deskriptoren (wie Attribute und Gleichnisklassifikatoren zum Erlernen der Attributrepräsentation auf mittlerer Ebene und Tom vs Pete zum Erlernen der semantischen Repräsentation auf hoher Ebene). ) finden sich in einschlägiger Literatur. 2014 veröffentlichte Facebook seine Arbeit auf cvpr14. Deepface kombinierte Big Data (4 Millionen Gesichtsdaten) mit einem tiefen Faltungsnetzwerk, das sich der Genauigkeit der menschlichen Erkennung auf dem LFW-Datensatz näherte. Deepface führt auch eine lokal verbundene Faltungsstruktur ein, um an jeder räumlichen Position einen separaten Faltungskern zu lernen. Der Nachteil ist, dass dies zu einer Parametererweiterung führt. Diese Struktur wurde später nicht populär. Deepid Family kann als Gruppe repräsentativer Arbeiten auf dem Gebiet der Gesichtserkennung in der DL-Ära angesehen werden. Das früheste Deepid-Netzwerk umfasste vier Faltungsschichten und eine übernommene Softmax-Verlustfunktion. Deepid2 berücksichtigt sowohl Identitätsverlust als auch Verifizierungsverlust auf der Grundlage des Deepid2-Netzwerks. Diese beiden Verluste können durch die Verwendung von Softmaxwithlos-Layer bzw. Kontrastverlust-Layer im Deep-Learning-Framework von Caffe realisiert werden. Das Deepid2-Netzwerk fügt jeder Schicht eine zusätzliche Verlustfunktion auf der Basis von deepid2 hinzu (ähnlich wie bei einem tiefen überwachten Netzwerk). Google hat seine Arbeit in cvpr2015 veröffentlicht. Facenet verwendet 22 Ebenen eines tiefen Faltungsnetzwerks und massive Gesichtsdaten (200 Millionen Bilder von 8 Millionen Menschen) und die Triple-Loss-Funktion, die häufig bei Bildabrufaufgaben verwendet wird. Es ist erwähnenswert, dass, da die Anzahl der Gesichtskategorien 8 Millionen erreicht, die Anzahl der Ausgabeschichtknoten 8 Millionen erreicht, wenn Softmax-Verlust verwendet wird, und dass mindestens 32 GB Videospeicher erforderlich sind (vorausgesetzt, der letzte Knoten der verborgenen Schicht hat 1024, unter Verwendung von Gleitkommazahlen mit einfacher Genauigkeit) Der Triplettverlust muss jedoch keinen zusätzlichen Videospeicher belegen. Facenets durchschnittliche Genauigkeit von 10 % Rabatt auf LFW-Datensatz erreicht 99,63 %, was auch das bisher beste Ergebnis in den offiziell veröffentlichten Papieren ist und fast das Ende des achtjährigen Leistungswettbewerbs auf LFW von 2008 bis 2015 ankündigt.

Entwicklung der Gesichtserkennung_ Taigewang-Technologie 1

Mach mit uns in Kontakt
empfohlene Artikel
Fälle
Die Einführung von LPR-Parkplatzlösungen Wir müssen uns mit einigen sehr komplexen Themen befassen, wenn wir dazu kommen, viele Dinge zu schreiben, die die Leute verstehen müssen
Die Einführung von lpr-ParklösungenLpr-Parksysteme werden jetzt in alle Arten von Pkw und leichten Lkw eingebaut. Sie wurden in einer Vielzahl von Branchen installiert
Die Einführung von lpr-ParklösungenEin Absatz für einen Blog mit dem Titel „Die Einführung von lpr-Parklösungen“, in dem sich der Abschnitt auf „Die Einführung von
Was sind die wichtigsten Faktoren, die vor dem Kauf von LPR-Parklösungen zu berücksichtigen sind? Ich kaufe schon seit einiger Zeit Parkausrüstung für mein Büro. Der einzige
Einführung in LPR-Parklösungen Wenn jemand mehr als eine Taste auf einem Gerät verwenden muss, entscheidet er sich meistens für die am häufigsten verwendete Taste
Was sind lpr-Parklösungen? Meistens wissen die Leute nicht, wonach sie in einem Parksystem suchen. Oft parken sie einfach am selben Ort und h
Die Einführung von lpr parking solutionsParkplatz und Parkautomat ist die einzige Möglichkeit, das Auto von Schmutz und Blättern zu befreien. Durch die Installation eines Pollers oder smart
Die Einführung von LPR-ParklösungenErfindung der modernen Welt ist sehr alt. Die Geschichte der Technik und des Fortschritts ist lang und vielfältig. Es hat adva gesehen
Die Einführung von lpr-ParklösungenLpr-Parksysteme sollen die Lebensqualität von Menschen erhöhen, die öffentliche Verkehrsmittel nutzen. Das einzige Problem
Einführung in lpr-Parklösungen Dies ist eine bekannte Methode, um in vielen Bereichen qualitativ hochwertige Ergebnisse zu erzielen. Es ist auch als prädiktive Methode für Makin bekannt
keine Daten
Shenzhen Tiger Wong Technology Co., Ltd ist der führende Anbieter von Zugangskontrolllösungen für intelligente Fahrzeugparksysteme, Nummernschilderkennungssysteme, Drehkreuze für Fußgängerzugangskontrolle, Gesichtserkennungsterminals und mehr LPR Park lösungen .
keine Daten
CONTACT US

Shenzhen Tiger Wong Technology Co.,Ltd

Tel:86 13717037584

Email: info@sztigerwong.com

Hinzufügen: 1. Etage, Gebäude A2, Silicon Valley Power Digital Industrial Park, Nr. 22 Dafu Road, Guanlan Street, Bezirk Longhua,

Shenzhen, Provinz Guangdong, China  

                    

Urheberrecht©2021 Shenzhen Tiger Wong Technology Co.,Ltd  | Seitenverzeichnis
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
stornieren
Customer service
detect