ซอฟต์แวร์สแกนนามบัตรของระบบการจดจำป้ายทะเบียนในโทรศัพท์สมาร์ทจำนวนมากมีฟังก์ชั่นนี้ เมื่อวันที่20พฤศจิกายน2018การรับรู้อักขระด้วยแสง (ต่อไปนี้เรียกว่า OCR) หมายถึงกระบวนการวิเคราะห์ภาพเพื่อรับข้อมูลข้อความ ชุดทดสอบการวิเคราะห์เอกสารนานาชาติและการประชุมการรับรู้ (icdar) ซึ่งเป็นตัวบ่งชี้ที่สำคัญในด้าน OCR ได้รับการฟื้นฟูอีกครั้ง มหาวิทยาลัยและรัฐวิสาหกิจของจีนติดอันดับห้าอันดับแรกใน icdar 2015ตามด้วย Pixel Anchor Nanjing University และ Nanjing University of Technology (psenet masktext, FOT) alibaba (inceptext) เน้นการจดจำข้อความและการประยุกต์ใช้ เพื่อปรับปรุงระดับการตรวจจับและการรับรู้ข้อความของฉากธรรมชาติการประชุมนานาชาติเกี่ยวกับการวิเคราะห์และการรับรู้เอกสารเป็นหนึ่งในการประชุมระดับมืออาชีพที่จัดโดย International Pattern Recognition Society (iapr) การประชุมนานาชาติเกี่ยวกับการวิเคราะห์และการรับรู้เอกสาร (icdar ได้จัดตั้งการแข่งขันการอ่านข้อความที่มีประสิทธิภาพในปี2003 (robustradecompetition ได้มีส่วนร่วมมากกว่า3500ทีมจาก89ประเทศ
Google microsoftamazon Facebook, มหาวิทยาลัยปักกิ่ง, มหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีของจีน, Tencent, Sogou ฯลฯ ได้มีส่วนร่วมในนั้น ผลการค้นหาสามารถส่งได้ตลอดเวลาและชุดข้อมูลการทดสอบของการแข่งขันการอ่านข้อความที่มีประสิทธิภาพได้รับการเผยแพร่ออนไลน์ ชุดข้อมูลการทดสอบของอัลกอริทึมการทดสอบในอุตสาหกรรมการตรวจจับข้อความฉากธรรมชาติ Icdar 2015และ icdar2017mlt เป็นชุดทดสอบสองชุด Cdar2015และ icdar2017mlt เป็นชุดข้อมูลที่มีสิทธิ์ในด้านการตรวจจับข้อความฉากธรรมชาติข่าวที่เพิ่มขึ้นสัมภาษณ์เทคโนโลยี Cloud Cong ซึ่งปัจจุบันอยู่ในอันดับแรกในรายการ icdar2015 Li Yuan วิศวกรอัลกอริทึมของสถาบันวิทยาศาสตร์และเทคโนโลยีแนะนำ โดยทั่วไปบทความทั้งหมดจะถูกตรวจพบในนั้น "ยังเป็นพื้นฐานของการจัดอันดับ รายการ Cdar2015 (20พฤศจิกายน2018) ค่าของ F หมายถึงค่าเฉลี่ยฮาร์มอนิกของความถูกต้องและอัตราการตรวจสอบ ค่า F ที่ใหญ่กว่าผลการตรวจสอบที่ดีกว่า
ความแม่นยำแสดงถึงสัดส่วนของข้อความที่ถูกต้องในผลการตรวจสอบอัตราการตรวจจับ (recal สะท้อนอัตราส่วนระหว่างข้อความที่ตรวจพบและจำนวนข้อความรูปภาพทั้งหมดซึ่งจะอธิบายถึงรายการสำหรับผู้สื่อข่าว สามารถสะท้อนได้ว่าข้อความดังกล่าวพลาดหรือไม่ เพื่อที่จะตรวจจับผลกระทบของอัลกอริทึมระบบการจดจำแผ่นป้ายทะเบียนต้องครอบคลุมพิจารณาความถูกต้องและอัตราการตรวจสอบ, และค่า F เพียงแสดงถึงค่าเฉลี่ยฮาร์โมนิกของความถูกต้องและอัตราการตรวจจับซึ่งเป็นพื้นฐานสำหรับการจัดอันดับ อดีตไม่ได้มีหน้าที่ในการตระหนักถึงข้อความดังนั้นจึงต้องสังเกตว่าหมายความว่าการตรวจจับข้อความฉากธรรมชาติที่กล่าวถึงในที่นี้ไม่เทียบเท่ากับการรับรู้ข้อความ หมายถึงการตรวจจับข้อความในรูปภาพ
เมื่อวันที่20พฤศจิกายน2018หลี่หยวนกล่าวว่า เทคโนโลยี yuncong เผยแพร่ผลกระดาษล่าสุดบนเว็บไซต์ preprint arXiv ซึ่งเสนอกรอบการยึดพิกเซลสำหรับการตรวจจับข้อความฉากธรรมชาติ ก่อนที่เอกสารจะได้รับการเผยแพร่จะได้รับการเผยแพร่โดยการประชุมนานาชาติเกี่ยวกับการวิเคราะห์เอกสารและการรับรู้อัลกอริธึมการยึดพิกเซลได้รับการทดสอบบนชุดข้อมูล icdar2015และ icdar2017mlt และผลลัพธ์ที่ดีที่สุดของ icdar2015ได้รับการฟื้นฟู มีรายงานว่า icdar2015ชุดข้อมูลการตรวจจับข้อความภาษาอังกฤษบริสุทธิ์ Icdar2017mlt มีเก้าภาษาเช่นภาษาละตินอังกฤษจีนเกาหลีญี่ปุ่นและอาหรับ อัลกอริธึมการยึดพิกเซลของ yuncong อยู่อันดับที่สี่ในรายการที่ครอบคลุม icdar2017mlt และสามประเทศที่ไม่มีเอกสารสาธารณะใดๆที่ส่งโดยสถาบันต่างประเทศ
การตรวจจับข้อความฉากธรรมชาติสามารถนำมาใช้ในเขตข้อมูลที่กว้างขึ้นแต่เมื่อเทียบกับการตรวจจับข้อความแบบดั้งเดิมการตรวจจับข้อความ OCR และการรับรู้ในสินค้าโภคภัณฑ์ต่างๆ, ชุดหรือภาพฉากธรรมชาติในฉากธรรมชาติเผชิญกับการแทรกแซงพื้นหลังที่ซับซ้อนเบลอข้อความและการย่อยสลายแสงที่คาดเดาไม่ได้ความหลากหลายของตัวอักษรข้อความแนวตั้งและข้อความเอียงระบบการจดจำป้ายทะเบียนจะถูกเปรียบเทียบกับ OCR แบบอนุรักษ์นิยมสำหรับภาพเอกสารที่มีคุณภาพสูงเช่นการวิเคราะห์ภาพการจดจำป้ายทะเบียนการกรองโฆษณาภาพความเข้าใจในฉาก, การรับรู้สินค้าโภคภัณฑ์การวางตำแหน่งมุมมองถนนการรับรู้บิลฯลฯ
เซินเจิ้น tigerwong เทคโนโลยีจำกัด
โทร:86 13717037584
อีเมล: ที่ info@sztigerwong.com
เพิ่ม: ชั้น 1 อาคาร A2 สวนอุตสาหกรรมดิจิทัลซิลิคอนวัลเลย์ พาวเวอร์ เลขที่ 22 ถนน Dafu ถนน Guanlan เขตหลงหัว
เซินเจิ้น มณฑลกวางตุ้ง ประเทศจีน