Нүүр царайг автоматаар таних сонгодог үйл явцыг гурван үе шатанд хуваадаг: нүүр царай илрүүлэх, нүүрний онцлогийн цэгийн байршил (нүүрний тэгшитгэх гэж нэрлэдэг), шинж чанарыг задлах, ангилагчийн дизайн. Ерөнхийдөө царай таних гэдэг нь явцуу утгаараа хамаарна
& quot; Онцлог шинж чанарыг ялгах ангилагч
& quot; Алгоритм судалгааны хоёр хэсэг. Гүнзгий суралцах арга гарч ирэхээс өмнө царай таних аргуудыг ерөнхийд нь өндөр хэмжээст хиймэл шинж чанарыг задлах (LBP, Gabor гэх мэт) болон хэмжээсийг багасгах гэсэн хоёр үе шатанд хуваадаг байв. Төлөөлөгчийн хэмжээсийг багасгах аргад PCA, LDA гэх мэт дэд орон зайн сургалтын аргууд, LPP зэрэг түгээмэл сургалтын аргууд орно. Гүнзгий суралцах аргууд түгээмэл болсны дараа төлөөлөх арга нь анхны зургийн орон зайгаас ялгаварлан гадуурхах нүүрний дүрслэлийг шууд сурах явдал юм. Ерөнхийдөө царай таних судалгааны түүхийг гурван үе шатанд хувааж болно. Эхний үе шатанд (1950-1980-аад он) нүүр царайг таних нь хэв маягийг таних ерөнхий асуудал гэж үздэг. Үндсэн технологи нь нүүрний геометрийн бүтцэд суурилсан байв. Хоёр дахь үе шатанд (1990-ээд он) нүүр царай таних технологи хурдацтай хөгжиж, хувийн нүүр царай, Фишерийн нүүр, уян харимхай график тааруулах зэрэг олон сонгодог аргууд гарч ирэв. Одоогийн байдлаар техникийн үндсэн чиглэл бол нүүр царайны загварчлал юм. Гуравдугаар үе шатанд (1990-ээд оны сүүлээс өнөөг хүртэл) нүүр царай таних судалгаа гүнзгийрч байна. Судлаачид бодит нөхцөлд нүүр царайг танихад анхаарлаа хандуулж эхэлсэн бөгөөд үүнд дараах дөрвөн тал дээр голчлон анхаарч эхэлсэн: 1) шугаман дискриминант шинжилгээгээр дүрслэгдсэн шугаман загварчлалын аргууд, цөмийн аргаар дүрсэлсэн шугаман бус загварчлалын арга, 3D царай таних аргад суурилсан янз бүрийн нүүрний орон зайн загваруудыг санал болгох. 3D мэдээлэл дээр. 2) Нүүр царайг танихад нөлөөлж буй хүчин зүйлс, тухайлбал гэрэлтүүлгийн хувиралгүй царай таних, инвариант царай таних, хувиршгүй царай таних зэрэгт гүнзгий дүн шинжилгээ хийж, судлах. 3) Орон нутгийн тодорхойлогч (Gabor face, LBP face гэх мэт) болон гүнзгий суралцах аргуудыг багтаасан шинэ функцүүдийн дүрслэлийг ашигладаг. 4) Видеонд суурилсан царай таних, ноорог болон хэт улаан туяаны ойролцоох зураг дээр суурилсан царай таних зэрэг мэдээллийн шинэ эх сурвалжийг ашиглах. 2007 оноос хойш LFW мэдээллийн сан нь бодит нөхцөлд нүүр царайг таних туршилтын жишиг болсон. LFW өгөгдлийн багц нь интернетээс авсан 5749 хүний 13233 нүүрний зургийг багтаасан бөгөөд үүнээс 1680 хүн хоёр ба түүнээс дээш зурагтай байна. LFW-ийн стандарт туршилтын протоколд 6000 хос нүүрийг арав дахин баталгаажуулах даалгавар багтсан болно. Нугалах бүрт 300 хос эерэг жишээ, 300 хос сөрөг жишээ багтана. Арав дахин дундаж нарийвчлалыг гүйцэтгэлийн үнэлгээний индекс болгон ашигладаг. LFW гарснаас хойш гүйцэтгэл нь байнга шинэчлэгдэж ирсэн. 2013 оноос өмнө техникийн үндсэн чиглэл нь хиймэл буюу сурахад суурилсан орон нутгийн хэмжилтийн арга байсан. 2014 оноос хойш техникийн үндсэн чиглэл нь гүнзгийрүүлэн суралцах явдал юм. 2014 оноос хойш том өгөгдлийг (их хэмжээний шошготой нүүрний өгөгдөл) гүнзгий судлах нь царай таних талбарт техникийн үндсэн чиглэл болсон. Хоёр чухал чиг хандлага нь: 1) сүлжээ улам томорч, гүнзгийрч байна (vggface16 давхарга, facenet22 давхарга). 2) Өсөн нэмэгдэж буй өгөгдлийн хэмжээ (deepface 4 сая, facenet 200 сая) нь том өгөгдөл нь царай таних ажиллагааг сайжруулах түлхүүр болсон. DL-ийн өмнөх эрин үед vipl лабораторийн 3-р үеийн болон хагас SDK-г жишээ болгон авч үзвэл техникийн гол зүйлд 1) нүүр царайны блокийн нэгдэл: Габорын онцлог LPQ функц орно. 2) Онцлогыг багасгахад зориулсан дэд орон зайн сургалт (PCA LDA). 3) Олон хэмжээст нүүрийг хэвийн болгох загварыг нэгтгэх. sdk3.5-ын холбогдох технологиуд нь FRGC 4-р туршилтын 0.1% алдаа хүлээн авах нөхцөлтэйгөөр 96%-ийн баталгаажуулалтын түвшинд хүрсэн нь FRGC-ийн мэдээллийн багц дахь хамгийн сайн үр дүн хэвээр байна. Хэдийгээр гүнзгий суралцах нь онцлог шинж чанартай суралцахыг чухалчилдаг ч сургалтын онцлог нь DL-ийн патент биш гэдгийг тэмдэглэх нь зүйтэй. DL-ээс өмнөх эрин үед гүехэн загваруудыг ашиглан дүрснүүдийн дүрслэлийг шууд сурах, хиймэл тодорхойлогч дээр суурилсан семантик дүрслэлийг сурах ажил (дунд түвшний шинж чанарын төлөөллийг сурахад зориулсан шинж чанар, зүйрлэл ангилагч, өндөр түвшний семантик дүрслэлийг сурахад Том vs Пит гэх мэт) ) холбогдох ном зохиолоос харж болно. 2014 онд Facebook өөрийн ажлаа cvpr14 дээр нийтэлсэн. Deepface нь том өгөгдлийг (4 сая нүүрний өгөгдөл) гүн гүнзгий эргэлтийн сүлжээтэй хослуулсан бөгөөд энэ нь LFW мэдээллийн багц дээр хүнийг таних нарийвчлалд ойртсон. Deepface нь орон зайн байрлал бүр дээр тус тусад нь хувиргах цөмийг сурахын тулд орон нутгийн холбогдсон эргэлтийн бүтцийг нэвтрүүлдэг. Сул тал нь параметрийг өргөтгөхөд хүргэдэг. Энэ бүтэц хожим нь алдартай болсонгүй. Гүнзгий гэр бүлийг DL эрин үеийн нүүр царай таних талбарт төлөөллийн бүлэг гэж үзэж болно. Хамгийн анхны гүн гүнзгий сүлжээ нь дөрвөн эвдрэлийн давхаргыг багтаасан бөгөөд softmax алдагдал функцийг нэвтрүүлсэн. Deepid2 нь deepid2 сүлжээний үндсэн дээр таних тэмдэг болон баталгаажуулалтын алдагдлыг хоёуланг нь авч үздэг. Эдгээр хоёр алдагдлыг Caffe-ийн гүнзгий сургалтын системд softmaxwithlos давхарга болон тодосгогч алдагдлын давхаргыг тус тус ашиглан ойлгож болно. Deepid2 сүлжээ нь deepid2 (гүн хяналттай сүлжээтэй төстэй) дээр үндэслэн давхарга бүрийн туслах алдагдлын функцийг нэмдэг. Google өөрийн ажлаа cvpr2015 онд нийтэлсэн. Facenet нь 22 давхаргын гүн эргэлддэг сүлжээ, асар том нүүрний өгөгдөл (8 сая хүний 200 сая зураг) ба гурвалсан алдагдлын функцийг ихэвчлэн зураг хайх ажилд ашигладаг. Нүүрний ангиллын тоо 8 саяд хүрдэг тул softmax алдагдлыг ашиглавал гаралтын давхаргын зангилааны тоо 8 саяд хүрч, дор хаяж 32 ГБ видео санах ой шаардлагатай (хамгийн сүүлийн далд давхаргын зангилаа байгаа гэж үзвэл) гэдгийг тэмдэглэх нь зүйтэй. 1024, нэг нарийвчлалтай хөвөгч цэгийн тоог ашиглан) Гэхдээ гурвалсан алдагдал нь нэмэлт видео санах ойг эзлэх шаардлагагүй. Facenet-ийн LFW өгөгдлийн багцад 10% хөнгөлөлт үзүүлэх дундаж нарийвчлал нь 99.63% хүрч байгаа нь 2008-2015 он хүртэл 8 жилийн LFW-ийн гүйцэтгэлийн уралдаан дууссаныг бараг зарлаж байгаа албан ёсоор нийтлэгдсэн нийтлэлүүдийн хамгийн сайн үр дүн юм.
![Царай таних_ Taigewang технологийн хөгжил 1]()