Олон ухаалаг гар утасны дугаар таних системийн нэрийн хуудас сканнердах программ хангамж нь ийм үүрэгтэй. 2018 оны 11-р сарын 20-ны өдөр оптик тэмдэгт таних (цаашид OCR гэх) нь текстийн мэдээллийг олж авахын тулд зурагт дүн шинжилгээ хийх үйл явцыг хэлнэ. OCR-ийн салбарын чухал үзүүлэлт болох олон улсын баримт бичгийн дүн шинжилгээ, хүлээн зөвшөөрөх бага хурлын (ICDAR) тестийн багц дахин шинэчлэгдэв. Хятадын их дээд сургууль, аж ахуйн нэгжүүд ICDAR 2015-д эхний тавд жагссан бол пикселийн зангуу Нанжингийн их сургууль, Нанжингийн технологийн их сургууль (psenet masktext, fot) Алибаба (inceptext) нь текстийг таних, хэрэглэхэд анхаардаг. Байгалийн үзэгдлийн текстийг илрүүлэх, таних түвшинг сайжруулах зорилгоор Олон улсын хэв маягийг таних нийгэмлэгээс (IAPR) зохион байгуулдаг мэргэжлийн бага хурлуудын нэг бол баримт бичигт дүн шинжилгээ хийх, хүлээн зөвшөөрөх олон улсын хурал юм. Баримт бичгийн дүн шинжилгээ, хүлээн зөвшөөрөх олон улсын бага хурал (ICDAR) нь 2003 онд хүчирхэг текст унших уралдааныг зохион байгуулсан (robustradecompetition-д өнөөг хүртэл 89 орны 3500 гаруй баг оролцсон байна.
Google microsoftamazon Facebook, Бээжингийн их сургууль, Хятадын Шинжлэх ухаан технологийн их сургууль, Tencent, Sogou гэх мэт. have participated in it. Үр дүнг хэдийд ч ирүүлэх боломжтой бөгөөд бат бөх текст унших уралдааны тестийн өгөгдлийн багцыг онлайнаар нийтэлсэн. Байгалийн үзэгдлийн текст илрүүлэх үйлдвэрлэлийн алгоритмын туршилтын өгөгдлийн багц. ICDAR 2015 болон icdar2017mlt нь туршилтын хоёр дэд багц юм. Cdar2015 болон icdar2017mlt нь байгалийн үзэгдлийн текст илрүүлэх талбарт эрх мэдэл бүхий мэдээллийн багц юм.Surging news нь одоогоор icdar2015 жагсаалтын нэгдүгээрт жагсаж буй Cloud Cong технологид ярилцлага өгсөн. Шинжлэх ухаан, технологийн хүрээлэнгийн алгоритмын инженер Ли Юань үүнийг танилцуулав. Үндсэндээ бүх нийтлэл үүн дээр илрэх болно "мөн зэрэглэлийн үндэс суурь юм. Cdar2015 жагсаалт (2018 оны 11-р сарын 20) F-ийн утга нь нарийвчлал ба илрүүлэх хурдны гармоник дундажийг илэрхийлнэ. F-ийн утга их байх тусам илрүүлэлтийн үр дүн сайн байна.
Нарийвчлал нь илрүүлэлтийн үр дүнд зөв текстийн эзлэх хувийг илэрхийлдэг; илрүүлэх хурд (санах нь илэрсэн текст болон зургийн текстийн нийт тооны хоорондын харьцааг тусгасан бөгөөд энэ нь сурвалжлагчийн жагсаалтыг тайлбарладаг. Энэ нь текстийг орхигдуулсан эсэхийг тусгаж болно. Алгоритмын үр нөлөөг илрүүлэхийн тулд автомашины дугаар таних систем нь нарийвчлал, илрүүлэлтийн хурдыг цогцоор нь авч үзэх шаардлагатай бөгөөд F утга нь нарийвчлал ба илрүүлэх хурдны гармоник дундажийг илэрхийлдэг бөгөөд энэ нь зэрэглэл тогтоох үндэс болдог. Эхнийх нь текстийг таних функцгүй тул үүнийг анхаарч үзэх хэрэгтэй Энэ нь энд дурдсан байгалийн үзэгдлийн текстийг илрүүлэх нь текстийг танихтай адилгүй гэсэн үг юм. Энэ нь зураг дээрх текстийг илрүүлэх гэсэн үг юм.
2018 оны арваннэгдүгээр сарын 20-нд Ли Юань хэлэв. Yuncong технологи нь байгалийн үзэгдлийн текстийг илрүүлэх пикселийн зангуу хүрээг санал болгосон arXiv вэбсайт дээр хамгийн сүүлийн үеийн цаасан эффектийг нийтэлсэн. Илтгэл хэвлэгдэхээс өмнө Баримт бичгийн шинжилгээ, таних олон улсын бага хурлаас гаргасан. Пикселийн зангуу алгоритмыг icdar2015 болон icdar2017mlt өгөгдлийн багц дээр туршсан бөгөөд icdar2015-ийн хамгийн сайн үр дүнг шинэчилсэн. Энэ нь icdar2015 цэвэр англи текст илрүүлэх мэдээллийн багц гэж мэдээлсэн байна. Icdar2017mlt нь Латин, Англи, Хятад, Солонгос, Япон, Араб зэрэг есөн хэлийг агуулдаг. Yuncong-ийн пиксел зангуу алгоритм нь icdar2017mlt иж бүрэн жагсаалтын дөрөвдүгээрт бичигдэж, эхний гурван орныг жагсаасан байна. Гадаадын байгууллагуудаас олон нийтийн нийтлэл ирүүлээгүй байна.
Байгалийн үзэгдлийн текст илрүүлэхийг илүү өргөн хүрээнд ашиглах боломжтой боловч уламжлалт текст илрүүлэх, OCR текст илрүүлэх, төрөл бүрийн бараа бүтээгдэхүүн, багц эсвэл байгалийн үзэгдлийн зурагтай харьцуулахад арын дэвсгэрийн нарийн төвөгтэй хөндлөнгийн оролцоо, текстийн бүдэгрэл, доройтол, урьдчилан таамаглах боломжгүй гэрэлтүүлэг, фонттой харьцуулахад олон талт байдал, босоо бичвэр, налуу бичвэр. Автомашины дугаар таних системийг фото шинжилгээ, машины дугаарыг таних, зураг сурталчилгааны шүүлтүүр, дүр зураг ойлгох, бараа таних, гудамжны харагдах байдал, төлбөр тооцоог таних зэрэг өндөр чанартай баримт бичгийн дүрслэлд зориулсан консерватив OCR системтэй харьцуулдаг. , гэх мэт.
Shenzhen TigerWong Technology Co.,Ltd
Утас: +86 13717037584
И-мэйл: info@sztigerwong.com
Нэмэх: 1-р давхар, А2 байр, Цахиурын хөндийн эрчим хүчний дижитал аж үйлдвэрийн парк, №. 22 Дафу зам, Гуанлан гудамж, Лонгхуа дүүрэг,
Шэньжэнь, Гуандун муж, Хятад