loading

Разработка распознавания лиц_ Технология Taigewang

Классический процесс автоматического распознавания лиц делится на три этапа: обнаружение лиц, определение местоположения характерной точки лица (также известное как выравнивание лица), извлечение признаков и разработка классификатора. Вообще говоря, распознавание лиц в узком смысле относится к & quot; Классификатор извлечения признаков & quot; Две части исследования алгоритма. До появления глубокого обучения методы распознавания лиц обычно делились на два этапа: извлечение искусственных признаков высокой размерности (таких как LBP, Gabor и т. д.) и уменьшение размеров. Репрезентативные методы уменьшения размерности включают методы обучения подпространств, такие как PCA и LDA, и популярные методы обучения, такие как LPP. После популярности методов глубокого обучения репрезентативный метод заключается в непосредственном изучении дискриминантного представления лица из исходного пространства изображения. В целом историю изучения распознавания лиц можно разделить на три этапа. На первом этапе (1950–1980-е годы) распознавание лиц рассматривалось как общая задача распознавания образов. Основная технология была основана на геометрической структуре лица. На втором этапе (1990-е годы) распознавание лиц быстро развивалось, и появилось много классических методов, таких как сопоставление собственных лиц, лиц Фишера и эластичных графов. В настоящее время основным техническим направлением является моделирование лица. На третьем этапе (с конца 1990-х гг. по настоящее время) углубляются исследования по распознаванию лиц. Исследователи начали обращать внимание на распознавание лиц в реальных условиях, в основном включая следующие четыре аспекта: 1) предлагать различные модели пространства лица, в том числе методы линейного моделирования, представленные линейным дискриминантным анализом, метод нелинейного моделирования, представленный методом ядра, и метод трехмерного распознавания лиц на основе по 3D информации. 2) Глубоко анализировать и изучать факторы, влияющие на распознавание лиц, включая распознавание лиц, не зависящее от освещения, распознавание лиц, не зависящее от позы, и распознавание лиц, не зависящее от выражения. 3) Используются новые представления признаков, включая локальные дескрипторы (лицо Габора, лицо LBP и т. д.) и методы глубокого обучения. 4) Использование новых источников данных, таких как распознавание лиц на основе видео и распознавание лиц на основе скетчей и изображений в ближнем инфракрасном диапазоне. С 2007 года база данных LFW стала тестовым эталоном для распознавания лиц в реальных условиях. Набор данных LFW включает 13233 изображения лиц 5749 человек из Интернета, из которых 1680 человек имеют два или более изображений. Стандартный протокол тестирования LFW включает десятикратное задание на подтверждение 6000 пар лиц. Каждая складка включает 300 пар положительных примеров и 300 пар отрицательных примеров. В качестве показателя оценки эффективности используется десятикратная средняя точность. С момента выпуска LFW производительность постоянно обновлялась. До 2013 года основным техническим путем было искусственное или основанное на обучении локальное дескрипторное измерение. После 2014 года основным техническим маршрутом является углубленное обучение. С 2014 года большие данные для глубокого обучения (массивные размеченные данные о лицах) стали основным техническим направлением в области распознавания лиц. Две важные тенденции: 1) сеть становится больше и глубже (уровень vggface16, уровень facenet22). 2) С увеличением объема данных (deepface 4 миллиона, facenet 200 миллионов) большие данные стали ключом к повышению производительности распознавания лиц. В эпоху до глубокого обучения, взяв в качестве примера SDK третьего поколения и половину SDK лаборатории vipl, ключевыми техническими моментами являются: 1) слияние элементов поверхности блока: функция Gabor LPQ. 2) Обучение подпространству для уменьшения признаков (PCA LDA). 3) Слияние многомасштабного шаблона нормализации лица. Связанные технологии sdk3.5 достигли уровня подтверждения 96 % при условии допустимого уровня ошибок 0,1 % в эксперименте 4 FRGC, что по-прежнему является лучшим результатом в наборе данных FRGC. Следует отметить, что, хотя глубокое обучение делает упор на изучение признаков, изучение признаков не является патентом глубокого обучения. В эпоху до глубокого обучения работа по непосредственному обучению представлению изображений с использованием неглубоких моделей и изучению семантического представления на основе искусственных дескрипторов (таких как атрибуты и классификатор сравнений для изучения представления атрибутов среднего уровня и Том против Пита для изучения семантического представления высокого уровня). ) встречаются в соответствующей литературе. В 2014 году Facebook опубликовал свою работу над cvpr14. Deepface объединил большие данные (4 миллиона данных о лицах) с глубокой сверточной сетью, которая приблизилась к точности распознавания человека в наборе данных LFW. Deepface также вводит локальную связанную структуру свертки для изучения отдельного ядра свертки в каждой пространственной позиции. Недостатком является то, что это приведет к расширению параметров. Позже эта структура не стала популярной. Семейство Deepid можно рассматривать как группу репрезентативных работ в области распознавания лиц в эпоху DL. Самая ранняя сеть deepid включала четыре слоя свертки и использовала функцию потерь softmax. Deepid2 учитывает как потерю личности, так и потерю проверки на основе сети deepid2. Эти две потери можно реализовать с помощью слоя softmaxwithlos и слоя потери контраста соответственно в среде глубокого обучения Caffe. Сеть Deepid2 добавляет вспомогательную функцию потерь каждого уровня на основе deepid2 (аналогично сети с глубоким наблюдением). Google опубликовал свою работу в cvpr2015. Facenet использует 22 слоя глубокой сверточной сети и массивные данные о лицах (200 миллионов изображений 8 миллионов человек) и функцию тройной потери, обычно используемую в задачах поиска изображений. Стоит отметить, что, поскольку количество категорий лиц достигает 8 миллионов, при использовании softmax loss количество узлов выходного слоя достигнет 8 миллионов, и потребуется не менее 32 ГБ видеопамяти (при условии, что последний узел скрытого слоя имеет 1024 с использованием чисел одинарной точности с плавающей запятой) Однако потеря триплетов не требует дополнительной видеопамяти. Средняя точность Facenet при 10% скидке на набор данных LFW достигает 99,63%, что также является лучшим результатом в официально опубликованных статьях на данный момент, почти объявляя об окончании восьмилетнего конкурса производительности на LFW с 2008 по 2015 год.

Разработка распознавания лиц_ Технология Taigewang 1

Свяжись с нами
Рекомендуемые статьи
Чехлы
Внедрение решений для парковки LPR Нам придется рассмотреть некоторые очень сложные вопросы, когда мы приступим к написанию многих вещей, которые люди должны понимать.
Внедрение парковочных решений LPR В настоящее время парковочные системы LPR устанавливаются на все виды легковых автомобилей и легких грузовиков. Они были установлены в различных отраслях промышленности.
Внедрение решений для парковки LPR. Параграф для блога под названием «Внедрение решений для парковки LPR», в котором основное внимание уделяется «Внедрению решений для парковки
Какие важные факторы следует учитывать перед покупкой парковочных решений LPR? Я уже некоторое время покупаю парковочное оборудование для своего офиса. Единственный
Введение в решения для парковки LPR. В большинстве случаев, когда кому-то нужно использовать более одной кнопки на устройстве, он выберет наиболее часто используемую кнопку.
Что такое парковочные решения lpr? Большую часть времени люди не знают, что они ищут в парковочной системе. Часто они просто паркуются на одном и том же месте и ч
Внедрение парковочных решений lprПарковочная машина и парковочная машина – единственное средство удаления грязи и листьев с автомобиля. Установив боллард или смарт
Внедрение парковочных решений LPRИзобретение современного мира очень старое. История техники и прогресса была долгой и разнообразной. Он видел Адва
Внедрение парковочных решений LPRСистемы парковки LPR призваны повысить качество жизни людей, пользующихся общественным транспортом. Единственная проблема
Знакомство с парковочными решениями LPRЭто хорошо известный метод получения высококачественных результатов во многих областях. Он также известен как метод прогнозирования для создания
нет данных
Shenzhen Tiger Wong Technology Co., Ltd является ведущим поставщиком решений для управления доступом для интеллектуальной системы парковки транспортных средств, системы распознавания номерных знаков, турникета контроля доступа для пешеходов, терминалов распознавания лиц и Решения для парковки LPR .
нет данных
CONTACT US

Шэньчжэнь TigerWong Technology Co.,Ltd

Тел:86 13717037584

Электронная почта: info@sztigerwong.com

Добавить: 1-й этаж, здание А2, Индустриальный парк Silicon Valley Power Digital, № 1. улица Дафу, 22, улица Гуанлан, район Лунхуа,

Шэньчжэнь, провинция Гуандун, Китай  

                    

Авторское право©2021 Шэньчжэнь TigerWong Technology Co.,Ltd  | Карта сайта
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
Отмена
Customer service
detect