برنامج مسح بطاقة العمل لنظام التعرف على لوحة الترخيص في العديد من الهواتف الذكية لديه هذه الوظيفة. في 20 نوفمبر 2018 ، يشير التعرف البصري على الأحرف (المشار إليه فيما يلي باسم OCR) إلى عملية تحليل الصور للحصول على معلومات نصية. تم تحديث مجموعة اختبار المؤتمر الدولي لتحليل الوثائق والتعرف عليها (ICDAR) ، وهو مؤشر مهم في مجال التعرف الضوئي على الحروف ، مرة أخرى. صنفت الجامعات والمؤسسات الصينية من بين الخمسة الأوائل في ICDAR 2015 ، تليها مذيع البكسل جامعة نانجينغ وجامعة نانجينغ للتكنولوجيا (psenet masktext ، fot) تركز Alibaba (inceptext) على التعرف على النص والتطبيق. من أجل تحسين مستوى اكتشاف النص والتعرف على المشاهد الطبيعية ، يعد المؤتمر الدولي لتحليل الوثائق والتعرف عليها أحد المؤتمرات المهنية التي تنظمها جمعية التعرف على الأنماط الدولية (IAPR). المؤتمر الدولي المعني بتحليل الوثائق والاعتراف بها (أنشأ ICDAR مسابقة قوية لقراءة النصوص في عام 2003 (شارك robustradecompetition حتى الآن أكثر من 3500 فريق من 89 دولة.
Google microsoft microsoftamazon Facebook ، جامعة بكين ، جامعة العلوم والتكنولوجيا في الصين ، Tencent ، Sogou ، إلخ. قد شاركت في ذلك. يمكن تقديم النتائج في أي وقت ، وقد تم نشر مجموعة بيانات الاختبار الخاصة بمسابقة قراءة النصوص القوية عبر الإنترنت. مجموعة بيانات الاختبار من خوارزمية الاختبار في صناعة الكشف عن نص المشهد الطبيعي. ICDAR 2015 و icdar2017mlt هما مجموعتان فرعيتين للاختبار. Cdar2015 و icdar2017mlt هي مجموعات بيانات موثوقة في مجال اكتشاف نص المشهد الطبيعي. أجرت الأخبار المتتالية مقابلات مع تقنية السحابة ، والتي تحتل حاليًا المرتبة الأولى في قائمة icdar2015. قدم لي يوان ، مهندس خوارزمية في معهد العلوم والتكنولوجيا ، تقديمه. في الأساس ، سيتم الكشف عن جميع المواد على ذلك "هو أيضا أساس الترتيب. قائمة Cdar2015 (20 نوفمبر 2018) تمثل قيمة F المتوسط التوافقي للدقة ومعدل الكشف. كلما كانت قيمة F أكبر ، كانت نتيجة الكشف أفضل.
تمثل الدقة نسبة النص الصحيح في نتيجة الكشف ؛ معدل الكشف (يعكس real النسبة بين النص المكتشف والعدد الإجمالي لنص الصورة ، وهو ما يفسر القائمة للمراسل. يمكن أن يعكس ما إذا كان قد تم تفويت النص. من أجل اكتشاف تأثير الخوارزمية ، يحتاج نظام التعرف على لوحة الترخيص إلى مراعاة الدقة ومعدل الكشف بشكل شامل ، وتمثل القيمة F فقط المتوسط التوافقي للدقة ومعدل الكشف ، وهو أيضًا أساس الترتيب. لا يحتوي الأول على وظيفة التعرف على النص ، لذلك يجب الإشارة إليه وهذا يعني أن اكتشاف نص المشهد الطبيعي المذكور هنا لا يعادل التعرف على النص. وهذا يعني الكشف عن النص في الصور.
في 20 نوفمبر 2018 ، قال لي يوان. نشرت تقنية Yuncong أحدث تأثير ورقي على موقع الطباعة المسبق arXiv ، والذي اقترح إطار عمل مرساة بكسل لاكتشاف نص المشهد الطبيعي. قبل نشر الورقة ، تم إصدارها من قبل المؤتمر الدولي لتحليل المستندات والتعرف عليها. تم اختبار خوارزمية مرساة البكسل على مجموعات بيانات icdar2015 و icdar2017mlt ، وتم تحديث أفضل نتائج icdar2015. يقال أن مجموعة بيانات اكتشاف النص الإنجليزية الخالصة icdar2015. يحتوي Icdar2017mlt على تسع لغات مثل اللاتينية والإنجليزية والصينية والكورية واليابانية والعربية. تحتل خوارزمية مرساة البكسل Yuncong المرتبة الرابعة في القائمة الشاملة icdar2017mlt الشاملة ، وأعلى ثلاث دول لم يتم تقديم أي أوراق عامة من قبل مؤسسات أجنبية.
يمكن تطبيق اكتشاف نص المشهد الطبيعي في مجال أوسع ، ولكن بالمقارنة مع اكتشاف النص التقليدي ، فإن اكتشاف نص OCR والتعرف عليه في مختلف السلع أو المجموعات أو صور المشهد الطبيعي في المشاهد الطبيعية تواجه تداخلًا معقدًا في الخلفية ، وطمس النص وتدهوره ، وإضاءة غير متوقعة ، وتنوع الخط ، النص الرأسي والنص المائل تتم مقارنة نظام التعرف على لوحة الترخيص مع OCR المحافظ لصور المستندات عالية الجودة ، مثل تحليل الصور ، والتعرف على لوحة الترخيص ، وتصفية إعلانات الصور ، وفهم المشهد ، والتعرف على السلع ، وتحديد موقع عرض الشارع ، والتعرف على الفاتورة ، إلخ.
شنتشن TigerWong التكنولوجيا المحدودة
الهاتف:86 13717037584
البريد الإلكتروني: info@sztigerwong.com
إضافة: الطابق الأول، المبنى A2، مجمع Silicon Valley Power Digital Industrial Park، رقم. 22 طريق دافو، شارع جوانلان، منطقة لونغهوا،
شنتشن، مقاطعة قوانغدونغ، الصين