កម្មវិធី វិភាគ កាត ពាក្យ របស់ ប្រព័ន្ធ ការ ទទួល ស្គាល់ បណ្ដាញ អាជ្ញាប័ណ្ណ នៅ ក្នុង ទូរស័ព្ទ ត្រឹមត្រូវ ច្រើន មាន មុខងារ នេះ ។ នៅ ឆ្នាំ ២០ ថែម ឆ្នាំ ២០០០ ដោយ ការ ទទួល ស្គាល់ តួអក្សរ អុបទិក (ឥឡូវ ដែល បាន ហៅ ជា OCR) យោង ទៅ លើ ដំណើរការ ការ វិភាគ រូបភាព ដើម្បី ទទួល ព័ត៌មាន អត្ថបទ ។ សំណុំ ការ សាកល្បង នៃ ការ វិភាគ រយសកម្ម និង ការ ទទួល ស្គាល់ ឯកសារ (ICDAR) ដែល អ្នក និពន្ធ សំខាន់ នៅ ក្នុង វាល OCR ត្រូវ បាន ធ្វើ ឲ្យ ស្រស់ ម្ដង ទៀត ។ ប្រតិទិន និង អ៊ីស្រាអែល ចិន មាន ចំណង ជើង ៥ កំពូល ក្នុង ICDAR ២០៥, ដែល បាន បន្ទាត់ ដោយ ភីកសែល ហ្គីង និង សាកលិបិក្រម Nanjig (psenet masktext, Ft) Alibaba (inceptext) ផ្ដោត លើ ការ ស្គាល់ អត្ថបទ និង កម្មវិធី ។ ដើម្បី បង្កើន ការ រក ឃើញ អត្ថបទ និង កម្រិត ការ ទទួល ស្គាល់ នៃ ទិដ្ឋភាព ធម្មតា ។ ការ វិភាគ រចនាប័ទ្ម លើ ការ វិភាគ និង ការ ទទួល ស្គាល់ ឯកសារ គឺ ជា មធ្យោបាយ មធ្យោបាយ មធ្យោបាយ ដែល បាន រៀបចំ ដោយ សិទ្ធិ វិនិច្ឆ័យ គំរូ សំណួរ លំដាប់ ស្គាល់ អក្ខរាវិរុទ្ធ (IAPR) ។ ការ វិភាគ រចនាប័ទ្ម លើ ការ វិភាគ និង ការ ទទួល ស្គាល់ ឯកសារ (ICDAR បាន បង្កើត សិទ្ធិ អាន អត្ថបទ ជម្រះ ក្នុង 2003 (robustradecompetition មាន ភារកិច្ច ថ្ងៃ នេះ រួម បញ្ចូល ក្រុម ច្រើន ជាង 3500 ពី ប្រទេស 89 ។
Google microsoftamazon Facebook, Phecking University of វិទ្យាសាស្ត្រ វិទ្យាសាស្ត្រ និង ទូទៅ ចិន, Tencent, Sogou, etc ។ បាន ចូលរួម ក្នុង វា ។ លទ្ធផល អាច ត្រូវ បាន ដាក់ស្នើ នៅពេល ណាមួយ ហើយ សំណុំ ទិន្នន័យ សាកល្បង នៃ ការ អាន អត្ថបទ កម្រិត ខ្ពស់ ត្រូវ បាន បោះពុម្ព ផ្សាយ លើ បណ្ដាញ ។ សំណុំ ទិន្នន័យ សាកល្បង របស់ ក្បួន សាកល្បង ក្នុង ការ រក ឃើញ អត្ថបទ មូលដ្ឋាន ធម្មតា ។ ICDAR 2015 និង icdar2017mlt គឺ ជា សំណុំ រង សាកល្បង ពីរ ។ Cdar2015 និង icdar2017mlt គឺ ជា សំណុំ ទិន្នន័យ អនុញ្ញាត ក្នុង វាល នៃ ការ រក ឃើញ អត្ថបទ ទិដ្ឋភាព ធម្មតា ។ ការ ប្រកាស ព័ត៌មាន បាន អួត ទូរស័ព្ទ ពពក Cong ដែល បច្ចុប្បន្ន លំដាប់ ដំបូង ក្នុង បញ្ជី icdar2015 ។ Li Yuan, ម៉ាស៊ីន បណ្ដាញ របស់ អង់គ្លេស របស់ វិទ្យាសាស្ត្រ និង ទូរស័ព្ទ, បាន បញ្ជាក់ វា ។ ជា មូលដ្ឋាន អត្ថបទ ទាំងអស់ នឹង ត្រូវ បាន រក ឃើញ នៅលើ វា " គឺ ជា មូលដ្ឋាន នៃ តម្លៃ ។ បញ្ជី Cdar2015 ( ២០ ថែមៀប, 2018) តម្លៃ របស់ F តំណាង ឲ្យ មធ្យម ភាព ត្រឹមត្រូវ និង អត្រា រកឃើញ ។ តម្លៃ F ធំ ជាង លទ្ធផល ល្អ បំផុត ។
ភាព ត្រឹមត្រូវ តំណាង ឲ្យ សមាមាត្រ នៃ អត្ថបទ ត្រឹមត្រូវ នៅ ក្នុង លទ្ធផល ការ រក ឃើញ ។ អត្រា ការ រក ឃើញ (កម្រិត បង្កើន សមាមាត្រ រវាង អត្ថបទ ដែល បាន រក ឃើញ និង ចំនួន អត្ថបទ សរុប របស់ រូបភាព ដែល ពន្យល់ បញ្ជី សម្រាប់ អ្នក រាយការណ៍ ។ វា អាច បង្ហាញ ថាតើ អត្ថបទ ត្រូវ បាន បាត់ ។ ដើម្បី រកឃើញ បែបផែន របស់ ក្បួន ។ ប្រព័ន្ធ ការ ទទួល ស្គាល់ អាជ្ញាប័ត៌មាន ត្រូវការ គិត ថា ភាព ត្រឹមត្រូវ និង អត្រា រក ឃើញ ដោយ ពាក្យ សម្ងាត់ ។ និង តម្លៃ F គ្រាន់ តែ បង្ហាញ មធ្យម នៃ អត្រា ភាព ត្រឹមត្រូវ និង ការ រក ឃើញ ដែល ជា មូលដ្ឋាន សម្រាប់ បន្ទាត់ ។ មុន មិន មាន មុខងារ នៃ អត្ថបទ ស្គាល់ ។ ដូច្នេះ វា ត្រូវ តែ ចំណាំ វា មានន័យ ថា ការ រក ឃើញ អត្ថបទ សំខាន់ ដែល បាន និយាយ នៅ ទីនេះ មិន ស្មើ នឹង ការ ស្គាល់ អត្ថបទ ។ វា មាន ន័យ ថា រក អត្ថបទ ក្នុង រូបភាព ។
នៅ ទី ២០ ខាង ឆ្នាំ ២០០៨ ដោយ លីយ៉ាន បាន និយាយ ។ បច្ចេកទេស Yuncong បាន បោះពុម្ព បោះពុម្ព បែបផែន ក្រដាស ចុងក្រោយ លើ តំបន់ បណ្ដាញ មុន arXiv ដែល បាន ស្នើ គ្រោងការណ៍ រចនាប័ទ្ម ភីកសែល សម្រាប់ ការ រក ឃើញ អត្ថបទ ទិដ្ឋភាព ធម្មតា ។ មុន នឹង ត្រូវ បាន បោះពុម្ព ផ្ទាំង ក្រដាស វា ត្រូវ បាន បោះពុម្ព ដោយ សម័យ ទូទៅ លើ ការ វិភាគ ឯកសារ និង ការ ទទួល ស្គាល់ ភារកិច្ច ភីកសែល ក្បឿន ក្ដារ ក្បឿង ត្រូវ បាន សាកល្បង លើ icdar2015 និង icdarName សំណុំ ទិន្នន័យ 2017 mlt និង លទ្ធផល ល្អិត នៃ icdar2015 ត្រូវ បាន ធ្វើ ឲ្យ ស្រស់ ។ វា ត្រូវ បាន រាយការណ៍ ថា សំណុំ ទិន្នន័យ រកឃើញ អត្ថបទ អង់គ្លេស icdar2015 ។ Icdar2017mlt មាន ៩ ភាសា ដូចជា ឡាតាំង, អង់គ្លេស, ចិន, កូរ៉ូនី, ជប៉ុន និង អារ៉ាប់ ។ ចំណុច អាល់ប៊ុម របស់ Yuncong របស់ ភីកសែល របស់ អ៊ីស្រាអែល ទីបួន នៅ ក្នុង បញ្ជី icdar2017mlt បំផុត និង ប្រទេស បី កំពូល ។ ចម្រៀក សាធារណៈ ត្រូវ បាន ដាក់ស្នើ ដោយ សម័យ ទំនាក់ទំនង ។
ការ រក ឃើញ អត្ថបទ ទិដ្ឋភាព ធម្មតា អាច ត្រូវ បាន អនុវត្ត នៅ ក្នុង វាល ច្រើន ប៉ុន្តែ ប្រៀបធៀប ជាមួយ ការ រកឃើញ អត្ថបទ បុរាណ ។ ការ រក ឃើញ អត្ថបទ OCR និង ការ ទទួល ស្គាល់ ក្នុង វត្ថុ ផ្សេងៗ សំណុំ បែបបទ ឬ រូបភាព តំបន់ ធម្មតា នៅ ក្នុង រូបរាង ផ្ទៃ ខាងក្រោយ ផ្ទៃ ខាងក្រោយ ប៉ះពាល់ ។ ពន្លឺ អត្ថបទ និង ការ ព្រិល លម្អិត ពុម្ពអក្សរ អត្ថបទ បញ្ឈរ និង អត្ថបទ ដែល បាន បង្ខំ ប្រព័ន្ធ ការ ទទួល ស្គាល់ អាជ្ញាបណ្ណ ដូចជា ការ វិភាគ រូបថត ការ ទទួល ស្គាល់ អាជ្ញាប័ណ្ណិត ការ ត្រង រូបភាព ការ ផ្លាស់ប្ដូរ រូបរាង, ការ ដឹង រូបថត ទីតាំង ទិដ្ឋភាព ផ្លូវ ការ ទទួល ស្គាល់ ប៊ីមល ។ ។
Shenzhen TigerWong Technology Co., Ltd
ទូរស័ព្ទ ៖86 13717037584
អ៊ីមែល៖ Info@sztigerwong.comGenericName
បន្ថែម៖ ជាន់ទី 1 អគារ A2 សួនឧស្សាហកម្មឌីជីថល Silicon Valley Power លេខ។ 22 ផ្លូវ Dafu, ផ្លូវ Guanlan, ស្រុក Longhua,
ទីក្រុង Shenzhen ខេត្ត GuangDong ប្រទេសចិន