loading

Desarrollo de reconocimiento facial_ Tecnología Taigewang

El proceso clásico de reconocimiento automático de rostros se divide en tres pasos: detección de rostros, ubicación de puntos de características faciales (también conocida como alineación de rostros), extracción de características y diseño de clasificador. En términos generales, el reconocimiento facial en un sentido estricto se refiere a & cita; Clasificador de extracción de características & cita; Dos partes de la investigación de algoritmos. Antes de la aparición del aprendizaje profundo, los métodos de reconocimiento facial generalmente se dividían en dos pasos: extracción de características artificiales de alta dimensión (como LBP, Gabor, etc.) y reducción de dimensiones. Los métodos de reducción de dimensión representativos incluyen métodos de aprendizaje subespaciales como PCA y LDA y métodos de aprendizaje populares como LPP. Después de la popularidad de los métodos de aprendizaje profundo, el método representativo consiste en aprender directamente la representación de la cara discriminante del espacio de la imagen original. En términos generales, la historia de la investigación del reconocimiento facial se puede dividir en tres etapas. En la primera etapa (décadas de 1950 a 1980), el reconocimiento facial se consideraba un problema general de reconocimiento de patrones. La tecnología dominante se basaba en la estructura geométrica de la cara. En la segunda etapa (década de 1990), el reconocimiento facial se desarrolló rápidamente y aparecieron muchos métodos clásicos, como el eigenface, el rostro de Fisher y la coincidencia de gráficos elásticos. En este momento, la ruta técnica principal es el modelado aparente. En la tercera etapa (desde finales de la década de 1990 hasta la actualidad), se ha ido profundizando la investigación sobre el reconocimiento facial. Los investigadores comenzaron a prestar atención al reconocimiento facial frente a condiciones reales, incluyendo principalmente los siguientes cuatro aspectos: 1) proponer diferentes modelos de espacio facial, incluidos métodos de modelado lineal representados por análisis discriminante lineal, método de modelado no lineal representado por método kernel y método de reconocimiento facial 3D basado en información 3D. 2) Analizar y estudiar profundamente los factores que afectan el reconocimiento facial, incluido el reconocimiento facial invariable de iluminación, el reconocimiento facial invariable de pose y el reconocimiento facial invariable de expresión. 3) Se utilizan nuevas representaciones de características, incluidos descriptores locales (cara de Gabor, cara de LBP, etc.) y métodos de aprendizaje profundo. 4) Usar nuevas fuentes de datos, como el reconocimiento facial basado en video y el reconocimiento facial basado en bocetos e imágenes infrarrojas cercanas. Desde 2007, la base de datos LFW se ha convertido en el punto de referencia de prueba para el reconocimiento facial en condiciones reales. El conjunto de datos de LFW incluye 13233 imágenes de rostros de 5749 personas de Internet, de las cuales 1680 personas tienen dos o más imágenes. El protocolo de prueba estándar de LFW incluye la tarea de confirmación de diez veces de 6000 pares de caras. Cada pliegue incluye 300 pares de ejemplos positivos y 300 pares de ejemplos negativos. La precisión del promedio de diez veces se utiliza como índice de evaluación del rendimiento. Desde el lanzamiento de LFW, el rendimiento se ha actualizado constantemente. Antes de 2013, la ruta técnica principal era el aprendizaje de medida de descriptor local artificial o basado en el aprendizaje. Después de 2014, la principal ruta técnica es el aprendizaje en profundidad. Desde 2014, el big data de aprendizaje profundo (datos masivos de rostros etiquetados) se ha convertido en la ruta técnica principal en el campo del reconocimiento facial. Dos tendencias importantes son: 1) la red se vuelve más grande y más profunda (capa vggface16, capa facenet22). 2) Con la creciente cantidad de datos (deepface 4 millones, facenet 200 millones), big data se ha convertido en la clave para mejorar el rendimiento del reconocimiento facial. En la era anterior a DL, tomando como ejemplo la tercera generación y la mitad del SDK de Vipl Laboratory, los puntos técnicos clave incluyen 1) fusión de funciones de cara de bloque: función Gabor LPQ. 2) Aprendizaje subespacial para reducción de características (PCA LDA). 3) Fusión de una plantilla de normalización facial multiescala. Las tecnologías relacionadas de sdk3.5 lograron una tasa de confirmación del 96 % bajo la condición de una tasa de aceptación de errores del 0,1 % en el Experimento 4 de FRGC, que sigue siendo el mejor resultado en el conjunto de datos de FRGC. Cabe señalar que, aunque el aprendizaje profundo enfatiza el aprendizaje de características, el aprendizaje de características no es la patente de DL. En la era anterior a DL, el trabajo de aprender directamente la representación de imágenes utilizando modelos superficiales y aprender la representación semántica basada en descriptores artificiales (como atributos y clasificador símil para aprender la representación de atributos de nivel medio y Tom vs Pete para aprender la representación semántica de alto nivel ) se ven en la literatura relevante. En 2014, Facebook publicó su trabajo en cvpr14. Deepface combinó big data (4 millones de datos faciales) con una red de convolución profunda, que se acercó a la precisión del reconocimiento humano en el conjunto de datos LFW. Deepface también introduce una estructura de convolución conectada local para aprender un núcleo de convolución separado en cada posición espacial. La desventaja es que conducirá a la expansión de parámetros. Esta estructura no se hizo popular más tarde. La familia Deepid puede considerarse como un grupo de trabajo representativo en el campo del reconocimiento facial en la era DL. La red deepid más antigua incluía cuatro capas de convolución y adoptaba la función de pérdida softmax. Deepid2 considera tanto la pérdida de identidad como la pérdida de verificación sobre la base de la red deepid2. Estas dos pérdidas se pueden realizar utilizando la capa softmaxwithlos y la capa de pérdida de contraste, respectivamente, en el marco de aprendizaje profundo de Caffe. La red Deepid2 agrega la función de pérdida auxiliar de cada capa sobre la base de deepid2 (similar a la red supervisada profunda). Google publicó su trabajo en cvpr2015. Facenet utiliza 22 capas de red de convolución profunda y datos faciales masivos (200 millones de imágenes de 8 millones de personas) y la función de pérdida triple que se usa comúnmente en tareas de recuperación de imágenes. Vale la pena mencionar que, dado que la cantidad de categorías de rostros alcanza los 8 millones, si se usa la pérdida de softmax, la cantidad de nodos de la capa de salida alcanzará los 8 millones y se requieren al menos 32 GB de memoria de video (suponiendo que el último nodo de la capa oculta tiene 1024, usando números de punto flotante de precisión simple) Sin embargo, la pérdida de triplete no necesita ocupar memoria de video adicional. La precisión promedio de Facenet del 10 % de descuento en el conjunto de datos de LFW alcanza el 99,63 %, que también es el mejor resultado en los documentos publicados oficialmente hasta el momento, casi anunciando el final de la competencia de rendimiento de ocho años en LFW de 2008 a 2015.

Desarrollo de reconocimiento facial_ Tecnología Taigewang 1

Póngase en contacto con nosotros
Artículos recomendados
Fundas
Encuentre el manual definitivo sobre soluciones eficientes de estacionamiento LPR proporcionado por Shenzhen TigerWong Technology Co., Ltd. Nuestra guía completa ofrece información sobre tecnología de vanguardia y explora estrategias de ahorro de costos para que los compradores puedan tomar decisiones informadas. ¡Confíe en nosotros para satisfacer todas sus necesidades de estacionamiento LPR!
La introducción de las soluciones de estacionamiento de lpr Vamos a tener que analizar algunos problemas muy complejos cuando lleguemos a escribir muchas cosas que la gente necesita entender.
La introducción de soluciones de estacionamiento lpr Los sistemas de estacionamiento lpr ahora se instalan en todo tipo de automóviles y camionetas. Se han instalado en una variedad de industrias.
La introducción de soluciones de estacionamiento lpr Un párrafo para un blog titulado 'La introducción de soluciones de estacionamiento lpr' donde la sección se centra en 'La introducción de
¿Cuáles son los factores importantes a considerar antes de comprar soluciones de estacionamiento de lpr? He estado comprando equipos de estacionamiento para mi oficina desde hace algún tiempo. El único
Introducción a las soluciones de estacionamiento de lpr La mayoría de las veces, cuando alguien necesita usar más de un botón en un dispositivo, elegirá usar el uso más común.
¿Qué son las soluciones de estacionamiento de lpr? La mayoría de las veces las personas no saben lo que están buscando en un sistema de estacionamiento. Muchas veces simplemente estacionan en el mismo lugar y h
La introducción de las soluciones de estacionamiento lpr El estacionamiento y la máquina de estacionamiento son los únicos medios para eliminar la suciedad y las hojas del automóvil. Mediante la instalación de una pilona o smart
La introducción de soluciones de estacionamiento lprLa invención del mundo moderno es muy antigua. La historia de la tecnología y el progreso ha sido larga y variada. Ha visto adva
La introducción de las soluciones de estacionamiento LPR Los sistemas de estacionamiento LPR están diseñados para aumentar la calidad de vida de las personas que utilizan el transporte público. El único problema
sin datos
Shenzhen Tiger Wong Technology Co., Ltd es el proveedor líder de soluciones de control de acceso para sistemas de estacionamiento inteligente de vehículos, sistemas de reconocimiento de matrículas, torniquetes de control de acceso de peatones, terminales de reconocimiento facial y Soluciones de estacionamiento LPR .
sin datos
CONTACT US

Shenzhen TigerWong Technology Co.... Ltd

Tel:86 13717037584

Correo electrónico: info@sztigerwong.com

Dirección: 1.er piso, edificio A2, parque industrial digital Silicon Valley Power, no. 22 Dafu Road, calle Guanlan, distrito de Longhua,

Shenzhen, provincia de GuangDong, China  

                    

Copyright©2021 Shenzhen TigerWong Technology Co.... Ltd  | Mapa del sitio
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
cancelar
Customer service
detect