loading

Desenvolvimento de Reconhecimento Facial_ Tecnologia Taigewang

O processo clássico de reconhecimento automático de face é dividido em três etapas: detecção de face, localização do ponto de recurso de face (também conhecido como alinhamento de face), extração de recurso e design do classificador. De um modo geral, o reconhecimento facial em sentido estrito refere-se a & quot; Classificador de extração de recursos & quot; Duas partes da pesquisa de algoritmos. Antes do surgimento do aprendizado profundo, os métodos de reconhecimento facial eram geralmente divididos em duas etapas: extração de recursos artificiais de alta dimensão (como LBP, Gabor, etc.) e redução de dimensão. Métodos de redução de dimensão representativos incluem métodos de aprendizado de subespaço, como PCA e LDA, e métodos de aprendizado populares, como LPP. Após a popularidade dos métodos de aprendizado profundo, o método representativo é aprender diretamente a representação discriminante da face do espaço da imagem original. De um modo geral, a história da pesquisa de reconhecimento facial pode ser dividida em três etapas. No primeiro estágio (décadas de 1950-1980), o reconhecimento facial foi considerado um problema geral de reconhecimento de padrões. A tecnologia mainstream foi baseada na estrutura geométrica do rosto. Na segunda fase (década de 1990), o reconhecimento facial desenvolveu-se rapidamente, e muitos métodos clássicos apareceram, como eigenface, Fisher face e elastic graph matching. Neste momento, a rota técnica dominante é a modelagem aparente da face. Na terceira etapa (do final da década de 1990 até o presente), as pesquisas sobre reconhecimento facial vêm se aprofundando. Os pesquisadores começaram a prestar atenção ao reconhecimento facial em condições reais, incluindo principalmente os quatro aspectos a seguir: 1) propor diferentes modelos de espaço de face, incluindo métodos de modelagem linear representados por análise discriminante linear, método de modelagem não linear representado pelo método kernel e método de reconhecimento facial 3D baseado em informações 3D. 2) Analise e estude profundamente os fatores que afetam o reconhecimento de rosto, incluindo reconhecimento de rosto invariável de iluminação, reconhecimento de rosto invariável de pose e reconhecimento de rosto invariável de expressão. 3) Novas representações de recursos são usadas, incluindo descritores locais (face Gabor, face LBP, etc.) e métodos de aprendizado profundo. 4) Usando novas fontes de dados, como reconhecimento facial baseado em vídeo e reconhecimento facial baseado em esboços e imagens de infravermelho próximo. Desde 2007, o banco de dados LFW tornou-se a referência de teste para reconhecimento facial em condições reais. O conjunto de dados LFW inclui 13.233 imagens de rosto de 5.749 pessoas da Internet, das quais 1.680 pessoas têm duas ou mais imagens. O protocolo de teste padrão do LFW inclui a tarefa de confirmação de dez vezes de 6.000 pares de faces. Cada dobra inclui 300 pares de exemplos positivos e 300 pares de exemplos negativos. A precisão média de dez vezes é usada como índice de avaliação de desempenho. Desde o lançamento do LFW, o desempenho foi constantemente atualizado. Antes de 2013, a principal rota técnica era a aprendizagem de medida de descritor local baseada em aprendizado ou artificial. Após 2014, a principal rota técnica é o aprendizado em profundidade. Desde 2014, big data de aprendizagem profunda (dados faciais rotulados em massa) tornou-se a rota técnica dominante no campo de reconhecimento facial. Duas tendências importantes são: 1) a rede se torna maior e mais profunda (camada vggface16, camada facenet22). 2) Com o aumento da quantidade de dados (deepface 4 milhões, facenet 200 milhões), big data tornou-se a chave para melhorar o desempenho do reconhecimento facial. Na era pré DL, tomando como exemplo o SDK de terceira geração e metade do laboratório vipl, os principais pontos técnicos incluem 1) fusão de recursos de face de bloco: recurso LPQ do recurso Gabor. 2) Aprendizado de subespaço para redução de recursos (PCA LDA). 3) Fusão do modelo de normalização de face multiescala. As tecnologias relacionadas do sdk3.5 alcançaram uma taxa de confirmação de 96% sob a condição de 0,1% de taxa de aceitação de erro no FRGC Experimento 4, que ainda é o melhor resultado no conjunto de dados FRGC. Deve-se notar que, embora o aprendizado profundo enfatize o aprendizado de recursos, o aprendizado de recursos não é patente da EAD. Na era pré DL, o trabalho de aprender diretamente a representação de imagens usando modelos superficiais e aprender representação semântica com base em descritores artificiais (como atributos e classificador símile para aprender representação de atributos de nível médio e Tom vs Pete para aprender representação semântica de alto nível ) são vistos na literatura relevante. Em 2014, o Facebook publicou seu trabalho no cvpr14. O Deepface combinou big data (4 milhões de dados de rosto) com rede de convolução profunda, que abordou a precisão do reconhecimento humano no conjunto de dados LFW. O Deepface também apresenta uma estrutura de convolução conectada local para aprender um kernel de convolução separado em cada posição espacial. A desvantagem é que isso levará à expansão dos parâmetros. Esta estrutura não se tornou popular mais tarde. A família Deepid pode ser considerada como um grupo de trabalho representativo no campo do reconhecimento facial na era DL. A primeira rede deepid incluiu quatro camadas de convolução e adotou a função de perda softmax. O Deepid2 considera a perda de identidade e a perda de verificação com base na rede deepid2. Essas duas perdas podem ser realizadas usando a camada softmaxwithlos e a camada de perda de contraste, respectivamente, na estrutura de aprendizado profundo do Caffe. A rede Deepid2 adiciona função de perda auxiliar de cada camada com base em deepid2 (semelhante à rede supervisionada profunda). O Google publicou seu trabalho em cvpr2015. O Facenet usa 22 camadas de rede de convolução profunda e dados de rosto massivos (200 milhões de imagens de 8 milhões de pessoas) e a função de perda tripla comumente usada em tarefas de recuperação de imagens. Vale ressaltar que, como o número de categorias de face chega a 8 milhões, se for usada a perda softmax, o número de nós da camada de saída chegará a 8 milhões, e são necessários pelo menos 32 GB de memória de vídeo (supondo que o último nó da camada oculta tenha 1024, usando números de ponto flutuante de precisão simples) No entanto, a perda de tripleto não precisa ocupar memória de vídeo adicional. A precisão média da Facenet de 10% de desconto no conjunto de dados LFW chega a 99,63%, que também é o melhor resultado nos artigos publicados oficialmente até agora, quase anunciando o fim da competição de desempenho de oito anos no LFW de 2008 a 2015.

Desenvolvimento de Reconhecimento Facial_ Tecnologia Taigewang 1

Entre em contato conosco
Artigos recomendados
Casos
A introdução de soluções de estacionamento lpr Teremos que analisar algumas questões muito complexas quando escrevermos muitas coisas que as pessoas precisam entender
A introdução das soluções de estacionamento lprOs sistemas de estacionamento lpr estão agora instalados em todos os tipos de automóveis e camiões ligeiros. Eles foram instalados em uma variedade de indústrias
A introdução de soluções de estacionamento lprUm parágrafo para um blog intitulado 'A introdução de soluções de estacionamento lpr' onde a seção se concentra em 'A introdução de
Quais são os fatores importantes a serem considerados antes de adquirir as soluções de estacionamento da lpr? Já há algum tempo que adquiro equipamentos de estacionamento para o meu escritório. O único
Introdução às soluções de estacionamento lprNa maioria das vezes, quando alguém precisa usar muito mais de um botão em um dispositivo, ele escolhe usar o mais comumente usado
O que são soluções de estacionamento lpr? Na maioria das vezes, as pessoas não sabem o que estão procurando em um sistema de estacionamento. Muitas vezes eles apenas estacionam no mesmo lugar e h
A introdução de soluções de estacionamento lpr Estacionamento e máquina de estacionamento é o único meio de remover a sujidade e as folhas do automóvel. Ao instalar um poste de amarração ou smart
A introdução de soluções de estacionamento lprA invenção do mundo moderno é muito antiga. A história da tecnologia e do progresso tem sido longa e variada. Ele viu adva
A introdução de soluções de estacionamento lprOs sistemas de estacionamento lpr foram concebidos para aumentar a qualidade de vida das pessoas que utilizam o transporte público. O único problema
Introdução às soluções de estacionamento lprEste é um método bem conhecido para obter resultados de alta qualidade em muitos campos. Também é conhecido como um método preditivo para fazer
sem dados
Shenzhen Tiger Wong Technology Co., Ltd é o fornecedor líder de soluções de controle de acesso para sistema de estacionamento inteligente de veículos, sistema de reconhecimento de placas, catraca de controle de acesso de pedestres, terminais de reconhecimento facial e Soluções de estacionamento LPR .
sem dados
CONTACT US

Tecnologia Co. de Shenzhen TigerWong, Ltd

Tel:86 13717037584

O email: info@sztigerwong.com

Adicionar: 1º Andar, Edifício A2, Silicon Valley Power Digital Industrial Park, No. Estrada Dafu 22, Rua Guanlan, Distrito de Longhua,

Shenzhen, província de Guangdong, China  

                    

Direitos autorais©Tecnologia TigerWong Shenzhen 2021 Co.,Ltd  | Mapa do site
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
cancelar
Customer service
detect