loading

تطوير التعرف على الوجوه_ تكنولوجيا Taigewang

تنقسم العملية الكلاسيكية للتعرف التلقائي على الوجوه إلى ثلاث خطوات: اكتشاف الوجه وموقع نقطة ميزة الوجه (المعروف أيضًا باسم محاذاة الوجه) واستخراج الميزات وتصميم المصنف. بشكل عام ، يشير التعرف على الوجوه بالمعنى الضيق إلى & مثل ؛ مصنف استخراج الميزات & مثل ؛ جزءان من أبحاث الخوارزمية. قبل ظهور التعلم العميق ، تم تقسيم طرق التعرف على الوجوه بشكل عام إلى خطوتين: استخراج الميزات الاصطناعية عالية الأبعاد (مثل LBP ، Gabor ، إلخ) وتقليل الأبعاد. تشمل طرق تقليل الأبعاد التمثيلية طرق تعلم الفضاء الجزئي مثل PCA و LDA وطرق التعلم الشائعة مثل LPP. بعد شعبية طرق التعلم العميق ، تتمثل الطريقة التمثيلية في التعرف مباشرة على تمثيل الوجه المميز من مساحة الصورة الأصلية. بشكل عام ، يمكن تقسيم تاريخ البحث في التعرف على الوجوه إلى ثلاث مراحل. في المرحلة الأولى (الخمسينيات والثمانينيات) ، اعتبر التعرف على الوجوه مشكلة عامة في التعرف على الأنماط. اعتمدت التكنولوجيا السائدة على البنية الهندسية للوجه. في المرحلة الثانية (التسعينيات) ، تطور التعرف على الوجوه بسرعة ، وظهرت العديد من الطرق الكلاسيكية ، مثل eigenface ، ووجه فيشر ، ومطابقة الرسم البياني المرن. في هذا الوقت ، يكون المسار التقني السائد هو النمذجة الواضحة. في المرحلة الثالثة (من نهاية التسعينيات حتى الوقت الحاضر) ، تعمق البحث في التعرف على الوجوه. بدأ الباحثون في الانتباه إلى التعرف على الوجوه التي تواجه ظروفًا حقيقية ، بما في ذلك الجوانب الأربعة التالية بشكل أساسي: 1) اقتراح نماذج مختلفة لفضاء الوجه ، بما في ذلك طرق النمذجة الخطية التي يمثلها التحليل التمييزي الخطي ، وطريقة النمذجة غير الخطية التي تمثلها طريقة النواة وطريقة التعرف على الوجوه ثلاثية الأبعاد القائمة على على المعلومات ثلاثية الأبعاد. 2) قم بتحليل ودراسة العوامل التي تؤثر على التعرف على الوجوه بعمق ، بما في ذلك التعرف على الوجه الثابت للإضاءة ، والتعرف على الوجه الثابت والتعبير عن التعرف على الوجوه بشكل ثابت. 3) يتم استخدام تمثيلات الميزات الجديدة ، بما في ذلك الواصفات المحلية (وجه غابور ، ووجه LBP ، وما إلى ذلك) وطرق التعلم العميق. 4) استخدام مصادر بيانات جديدة ، مثل التعرف على الوجه بناءً على الفيديو والتعرف على الوجوه بناءً على رسم تخطيطي وصور الأشعة تحت الحمراء القريبة. منذ عام 2007 ، أصبحت قاعدة بيانات LFW هي معيار الاختبار للتعرف على الوجوه في ظل الظروف الحقيقية. تتضمن مجموعة بيانات LFW 13233 صورة وجه لـ 5749 شخصًا من الإنترنت ، منهم 1680 شخصًا لديهم صورتان أو أكثر. يتضمن بروتوكول الاختبار القياسي لـ LFW مهمة التأكيد العشرة أضعاف لـ 6000 زوج من الوجوه. تتضمن كل طية 300 زوجًا من الأمثلة الإيجابية و 300 زوجًا من الأمثلة السلبية. يتم استخدام متوسط ​​الدقة العشرة أضعاف كمؤشر تقييم الأداء. منذ إصدار LFW ، تم تحديث الأداء باستمرار. قبل عام 2013 ، كان المسار التقني الرئيسي مصطنعًا أو قائمًا على التعلم المحلي الواصف لقياس التعلم. بعد عام 2014 ، كان المسار التقني الرئيسي هو التعلم المتعمق. منذ عام 2014 ، أصبحت البيانات الضخمة للتعلم العميق (بيانات الوجه الضخمة المسماة) هي المسار التقني السائد في مجال التعرف على الوجوه. اتجاهان مهمان هما: 1) تصبح الشبكة أكبر وأعمق (طبقة vggface16 ، طبقة facenet22). 2) مع زيادة كمية البيانات (الوجه العميق 4 ملايين ، الوجه العميق 200 مليون) ، أصبحت البيانات الضخمة هي المفتاح لتحسين أداء التعرف على الوجوه. في حقبة ما قبل DL ، بأخذ الجيل الثالث والنصف من SDK لمختبر vipl كمثال ، تشمل النقاط الفنية الرئيسية 1) اندماج ميزة وجه الكتلة: ميزة Gabor ميزة LPQ. 2) تعلم المساحة الجزئية لتقليل الميزات (PCA LDA). 3) دمج قالب تطبيع الوجه متعدد المقاييس. حققت التقنيات ذات الصلة لـ sdk3.5 معدل تأكيد بنسبة 96٪ بشرط معدل قبول خطأ بنسبة 0.1٪ في تجربة FRGC 4 ، والتي لا تزال أفضل نتيجة في مجموعة بيانات FRGC. وتجدر الإشارة إلى أنه على الرغم من أن التعلم العميق يركز على تعلم الميزات ، فإن ميزات التعلم ليست براءة اختراع للتعلم من أجل التعلم. في حقبة ما قبل DL ، كان عمل التمثيل التعليمي المباشر من الصور باستخدام النماذج الضحلة والتمثيل الدلالي التعليمي استنادًا إلى الواصفات الاصطناعية (مثل السمات ومصنف التشبيه لتعلم تمثيل السمات على المستوى المتوسط ​​و Tom vs Pete لتعلم التمثيل الدلالي عالي المستوى ) في الأدبيات ذات الصلة. في عام 2014 ، نشر Facebook أعماله على cvpr14. جمعت Deepface البيانات الضخمة (4 ملايين بيانات وجه) مع شبكة التفاف عميقة ، والتي اقتربت من دقة التعرف البشري على مجموعة بيانات LFW. يقدم Deepface أيضًا بنية التفاف محلية متصلة لتعلم نواة التفاف منفصلة في كل موضع مكاني. العيب هو أنه سيؤدي إلى توسيع المعلمة. لم يصبح هذا الهيكل شائعًا في وقت لاحق. يمكن اعتبار عائلة Deepid كمجموعة من الأعمال التمثيلية في مجال التعرف على الوجوه في عصر DL. تضمنت أقدم شبكة عميقة أربع طبقات التفاف واعتمدت وظيفة فقدان softmax. يعتبر Deepid2 فقدان الهوية وفقدان التحقق على أساس شبكة deepid2. يمكن تحقيق هذين الخسرين باستخدام طبقة softmaxwithlos وطبقة فقدان التباين على التوالي في إطار عمل التعلم العميق Caffe. تضيف شبكة Deepid2 وظيفة خسارة مساعدة لكل طبقة على أساس deepid2 (على غرار الشبكة الخاضعة للإشراف العميق). نشرت Google أعمالها في cvpr2015. يستخدم Facenet 22 طبقة من شبكة الالتواء العميق وبيانات وجه ضخمة (200 مليون صورة لـ 8 ملايين شخص) ووظيفة الخسارة الثلاثية المستخدمة بشكل شائع في مهام استرجاع الصور. تجدر الإشارة إلى أنه نظرًا لأن عدد فئات الوجوه يصل إلى 8 ملايين ، في حالة استخدام خسارة softmax ، سيصل عدد عقد طبقة الإخراج إلى 8 ملايين ، ويلزم وجود ذاكرة فيديو 32 جيجا على الأقل (بافتراض أن آخر عقدة طبقة مخفية بها 1024 ، باستخدام أرقام الفاصلة العائمة ذات الدقة الواحدة) ومع ذلك ، لا يحتاج الخسارة الثلاثية إلى شغل ذاكرة فيديو إضافية. يصل متوسط ​​دقة Facenet لخصم 10٪ على مجموعة بيانات LFW إلى 99.63٪ ، وهي أيضًا أفضل نتيجة في الأوراق المنشورة رسميًا حتى الآن ، حيث تُعلن تقريبًا نهاية مسابقة الأداء التي استمرت ثماني سنوات على LFW من 2008 إلى 2015.

تطوير التعرف على الوجوه_ تكنولوجيا Taigewang 1

ابق على تواصل معنا
مقالات مقترحة
حالات
مقدمة لحلول وقوف السيارات lpr سيتعين علينا النظر في بعض المشكلات المعقدة للغاية عندما نأتي إلى كتابة الكثير من الأشياء التي يحتاج الناس إلى فهمها
إدخال حلول وقوف السيارات lpr مثبتة الآن في جميع أنواع السيارات والشاحنات الخفيفة. لقد تم تركيبها في مجموعة متنوعة من الصناعات
تقديم حلول مواقف السيارات lpr فقرة في مدونة بعنوان "مقدمة لحلول وقوف السيارات lpr" حيث يركز القسم على "مقدمة
ما هي العوامل المهمة التي يجب مراعاتها قبل شراء حلول وقوف السيارات lpr؟ لقد قمت بشراء معدات وقوف السيارات لمكتبي منذ بعض الوقت. الوحيد
مقدمة عن حلول مواقف السيارات lpr
ما هي حلول وقوف السيارات lpr؟ في معظم الأحيان لا يعرف الناس ما الذي يبحثون عنه في نظام وقوف السيارات. في كثير من الأحيان يوقفون سياراتهم في نفس المكان و h
إدخال حلول وقوف السيارات lpr عن طريق تثبيت مربط الحبال أو الذكية
تقديم حلول وقوف السيارات lpr: اختراع العالم الحديث قديم جدًا. كان تاريخ التكنولوجيا والتقدم طويلًا ومتنوعًا. لقد شهدت adva
تقديم حلول وقوف السيارات lpr تم تصميم أنظمة وقوف السيارات lpr لزيادة جودة الحياة للأشخاص الذين يستخدمون وسائل النقل العام. المشكلة الوحيدة
مقدمة في حلول مواقف السيارات lpr: هذه طريقة معروفة للحصول على نتائج عالية الجودة في العديد من المجالات. يُعرف أيضًا باسم الطريقة التنبؤية لماكين
لايوجد بيانات
شركة Shenzhen Tiger Wong Technology Co. ، Ltd هي المزود الرائد لحلول التحكم في الوصول لنظام وقوف السيارات الذكي ، ونظام التعرف على لوحة الترخيص ، والبوابة الدوارة للتحكم في وصول المشاة ، ومحطات التعرف على الوجه و حلول مواقف السيارات LPR .
لايوجد بيانات
CONTACT US

شنتشن TigerWong التكنولوجيا المحدودة

الهاتف:86 13717037584

البريد الإلكتروني: info@sztigerwong.com

إضافة: الطابق الأول، المبنى A2، مجمع Silicon Valley Power Digital Industrial Park، رقم. 22 طريق دافو، شارع جوانلان، منطقة لونغهوا،

شنتشن، مقاطعة قوانغدونغ، الصين  

                    

Copyright©2021 شنتشن TigerWong التكنولوجيا المحدودة  | خريطة الموقع
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
إلغاء
Customer service
detect