loading

Sviluppo della tecnologia di riconoscimento facciale_ Taigewang

Il classico processo di riconoscimento facciale automatico è suddiviso in tre fasi: rilevamento del volto, posizione del punto caratteristico del volto (noto anche come allineamento del volto), estrazione delle caratteristiche e design del classificatore. In generale, si intende il riconoscimento facciale in senso stretto & citazione; Classificatore di estrazione di caratteristiche & citazione; Due parti della ricerca sugli algoritmi. Prima dell'emergere del deep learning, i metodi di riconoscimento facciale erano generalmente divisi in due fasi: estrazione di caratteristiche artificiali ad alta dimensione (come LBP, Gabor, ecc.) e riduzione delle dimensioni. I metodi di riduzione della dimensione rappresentativa includono metodi di apprendimento subspaziale come PCA e LDA e metodi di apprendimento popolari come LPP. Dopo la popolarità dei metodi di apprendimento profondo, il metodo rappresentativo consiste nell'apprendere direttamente la rappresentazione del volto discriminante dallo spazio dell'immagine originale. In generale, la storia della ricerca sul riconoscimento facciale può essere suddivisa in tre fasi. Nella prima fase (anni '50-'80), il riconoscimento facciale era considerato un problema generale di riconoscimento di schemi. La tecnologia principale si basava sulla struttura geometrica del viso. Nella seconda fase (anni '90), il riconoscimento facciale si sviluppò rapidamente e apparvero molti metodi classici, come eigenface, Fisher face e la corrispondenza di grafici elastici. In questo momento, il percorso tecnico tradizionale è il modello apparente. Nella terza fase (dalla fine degli anni '90 ad oggi) si è approfondita la ricerca sul riconoscimento facciale. I ricercatori hanno iniziato a prestare attenzione al riconoscimento facciale in condizioni reali, includendo principalmente i seguenti quattro aspetti: 1) proporre diversi modelli di spazio facciale, inclusi metodi di modellazione lineare rappresentati dall'analisi discriminante lineare, metodo di modellazione non lineare rappresentato dal metodo del kernel e metodo di riconoscimento facciale 3D basato su informazioni 3D. 2) Analizzare e studiare in modo approfondito i fattori che influenzano il riconoscimento facciale, incluso il riconoscimento facciale invariante dell'illuminazione, il riconoscimento facciale invariante della posa e il riconoscimento facciale invariante dell'espressione. 3) Vengono utilizzate nuove rappresentazioni delle caratteristiche, inclusi descrittori locali (faccia Gabor, faccia LBP, ecc.) e metodi di deep learning. 4) Utilizzo di nuove fonti di dati, come il riconoscimento facciale basato su video e il riconoscimento facciale basato su schizzi e immagini del vicino infrarosso. Dal 2007, il database LFW è diventato il benchmark di test per il riconoscimento facciale in condizioni reali. Il set di dati LFW include 13233 immagini di volti di 5749 persone da Internet, di cui 1680 persone hanno due o più immagini. Il protocollo di test standard di LFW include l'attività di conferma dieci volte di 6000 paia di facce. Ogni piega include 300 paia di esempi positivi e 300 paia di esempi negativi. L'accuratezza media di dieci volte viene utilizzata come indice di valutazione delle prestazioni. Dal rilascio di LFW, le prestazioni sono state costantemente aggiornate. Prima del 2013, il percorso tecnico principale era l'apprendimento della misura del descrittore locale artificiale o basato sull'apprendimento. Dopo il 2014, il percorso tecnico principale è l'apprendimento approfondito. Dal 2014, i big data del deep learning (massicci dati sui volti etichettati) sono diventati la via tecnica principale nel campo del riconoscimento facciale. Due tendenze importanti sono: 1) la rete diventa più grande e più profonda (livello vggface16, livello facenet22). 2) Con la crescente quantità di dati (4 milioni di deepface, 200 milioni di facenet), i big data sono diventati la chiave per migliorare le prestazioni del riconoscimento facciale. Nell'era pre DL, prendendo come esempio l'SDK di terza generazione e mezzo del laboratorio vipl, i punti tecnici chiave includono 1) fusione di funzionalità faccia a blocchi: funzionalità Gabor caratteristica LPQ. 2) Apprendimento del sottospazio per la riduzione delle caratteristiche (PCA LDA). 3) Fusione del modello di normalizzazione del viso multiscala. Le tecnologie correlate di sdk3.5 hanno raggiunto un tasso di conferma del 96% a condizione di un tasso di accettazione dell'errore dello 0,1% nell'esperimento 4 dell'FRGC, che è ancora il miglior risultato nel set di dati dell'FRGC. Va notato che sebbene il deep learning enfatizzi l'apprendimento delle funzionalità, le funzionalità di apprendimento non sono il brevetto di DL. Nell'era pre DL, il lavoro di apprendimento diretto della rappresentazione dalle immagini utilizzando modelli superficiali e l'apprendimento della rappresentazione semantica basata su descrittori artificiali (come attributi e classificatore di similitudine per l'apprendimento della rappresentazione degli attributi di livello medio e Tom vs Pete per l'apprendimento della rappresentazione semantica di alto livello ) sono presenti nella letteratura pertinente. Nel 2014 Facebook ha pubblicato il suo lavoro su cvpr14. Deepface ha combinato i big data (4 milioni di dati sui volti) con una rete a convoluzione profonda, che si è avvicinata all'accuratezza del riconoscimento umano sul set di dati LFW. Deepface introduce anche una struttura di convoluzione connessa locale per apprendere un kernel di convoluzione separato in ogni posizione spaziale. Lo svantaggio è che porterà all'espansione dei parametri. Questa struttura non divenne popolare in seguito. La famiglia Deepid può essere considerata come un gruppo di lavoro rappresentativo nel campo del riconoscimento facciale nell'era DL. La prima rete deepid includeva quattro strati di convoluzione e adottava la funzione di perdita softmax. Deepid2 considera sia la perdita di identità che la perdita di verifica sulla base della rete deepid2. Queste due perdite possono essere realizzate utilizzando rispettivamente lo strato softmaxwithlos e lo strato di perdita di contrasto nel framework di deep learning di Caffe. La rete Deepid2 aggiunge la funzione di perdita ausiliaria di ciascun livello sulla base di deepid2 (simile alla rete supervisionata in profondità). Google ha pubblicato il suo lavoro in cvpr2015. Facenet utilizza 22 strati di rete a convoluzione profonda e enormi dati sui volti (200 milioni di immagini di 8 milioni di persone) e la funzione di tripla perdita comunemente utilizzata nelle attività di recupero delle immagini. Vale la pena ricordare che, poiché il numero di categorie di volti raggiunge gli 8 milioni, se viene utilizzata la perdita softmax, il numero di nodi del livello di output raggiungerà 8 milioni e sono necessari almeno 32 GB di memoria video (supponendo che l'ultimo nodo del livello nascosto abbia 1024, utilizzando numeri a virgola mobile a precisione singola) Tuttavia, la perdita di triplette non deve occupare memoria video aggiuntiva. L'accuratezza media di Facenet del 10% di sconto sul set di dati LFW raggiunge il 99,63%, che è anche il miglior risultato nei documenti ufficiali pubblicati finora, annunciando quasi la fine della competizione sulle prestazioni di otto anni su LFW dal 2008 al 2015.

Sviluppo della tecnologia di riconoscimento facciale_ Taigewang 1

Mettiti in contatto con noi
Articoli raccomandati
Custodie
L'introduzione delle soluzioni di parcheggio LPR Dovremo esaminare alcune questioni molto complesse quando arriveremo a scrivere molte cose che le persone devono capire
L'introduzione delle soluzioni di parcheggio Lpr I sistemi di parcheggio Lpr sono ora installati in tutti i tipi di auto e autocarri leggeri. Sono stati installati in una varietà di settori
L'introduzione delle soluzioni di parcheggio lprUn paragrafo per un blog intitolato "L'introduzione delle soluzioni di parcheggio lpr" in cui la sezione si concentra su "L'introduzione di
Quali sono i fattori importanti da considerare prima di acquistare le soluzioni di parcheggio lpr? Acquisto da tempo le attrezzature per il parcheggio del mio ufficio. L'unico
Introduzione alle soluzioni di parcheggio lpr La maggior parte delle volte quando qualcuno ha bisogno di usare molto più di un pulsante su un dispositivo, sceglierà di usare il più comunemente usato
Che cosa sono le soluzioni di parcheggio lpr? La maggior parte delle volte le persone non sanno cosa stanno cercando in un sistema di parcheggio. Molte volte parcheggiano nello stesso posto e h
L'introduzione delle soluzioni di parcheggio lprIl parcheggio e la macchina da lotto sono l'unico mezzo per rimuovere lo sporco e le foglie dall'auto. Installando un dissuasore o smart
L'introduzione delle soluzioni di parcheggio lprL'invenzione del mondo moderno è molto antica. La storia della tecnologia e del progresso è stata lunga e varia. Ha visto adva
L'introduzione delle soluzioni di parcheggio lprI sistemi di parcheggio Lpr sono progettati per aumentare la qualità della vita delle persone che utilizzano i mezzi pubblici. L'unico problema
Introduzione alle soluzioni di parcheggio lprQuesto è un metodo ben noto per ottenere risultati di alta qualità in molti campi. È anche noto come metodo predittivo per makin
nessun dato
Shenzhen Tiger Wong Technology Co., Ltd è il principale fornitore di soluzioni di controllo degli accessi per sistemi di parcheggio intelligenti per veicoli, sistemi di riconoscimento delle targhe, tornelli per il controllo degli accessi pedonali, terminali di riconoscimento facciale e Soluzioni di parcheggio LPR .
nessun dato
CONTACT US

Tecnologia Co.,Ltd di Shenzhen TigerWong

Tel:86 13717037584

E-mail: info@sztigerwong.com

Aggiungi: 1° piano, edificio A2, parco industriale digitale Silicon Valley Power, n. 22 Dafu Road, Guanlan Street, distretto di Longhua,

Shenzhen, provincia di Guangdong, Cina  

                    

Diritto d'autore©Shenzhen TigerWong Technology Co.,Ltd 2021  | Mappa del sito
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
Annulla
Customer service
detect