許多智能手機中的車牌識別系統名片掃描軟件都具有此功能。 2018年11月20日,光學字符識別 (以下簡稱OCR) 是指對圖像進行分析以獲取文本信息的過程。 OCR領域的重要指標國際文檔分析與識別會議 (ICDAR) 的測試集再次刷新。 中國高校和企業在ICDAR 2015中排名前五,其次是像素錨南京大學和南京工業大學 (psenet masktext,fot) 阿里巴巴 (inceptext) 專注於文本識別和應用。 為了提高自然場景的文本檢測和識別水平,國際文檔分析與識別會議是國際模式識別協會 (IAPR) 組織的專業會議之一。 國際文件分析和認可會議 (ICDAR建立了強大的文本閱讀競賽2003年 (迄今為止,robustradecompetition已涉及來自89個國家的3500多個團隊。
Google microsoftamazon Facebook、北京大學、中國科學技術大學、騰訊、搜狗等。 參與其中。 結果可以隨時提交,魯棒文本閱讀競賽的測試數據集已經在線發布。 自然場景文本檢測行業中測試算法的測試數據集 ICDAR 2015和icdar2017mlt是兩個測試子集。 Cdar2015和icdar2017mlt是自然場景文本檢測領域的權威數據集,澎湃新聞採訪了目前在icdar2015榜單中排名第一的雲叢科技。 理工學院算法工程師李元介紹。 基本上所有文章都會在上面被檢測到」也是排名的基礎。 Cdar2015列表 (2018年11月20日) F的值表示精度和檢測率的諧波平均值。 F值越大,檢測結果越好。
精度表示正確文本在檢測結果中的比例; 檢測率 (recal反映了檢測到的文本與圖片文本總數之間的比率,這說明了報告者的列表。 它可以反映文本是否被遺漏了。 為了檢測算法的效果,車牌識別系統需要綜合考慮準確率和檢測率,而f值正好代表了準確率和檢測率的諧波平均值,這也是排序的依據。 前者不具有識別文本的功能,因此需要注意的是,這裡所說的自然場景文本檢測並不等同於文本識別。 意思是檢測圖片中的文字。
關於2018年11月20日,李媛說。 雲從科技在預印本網站arXiv上發表了最新的論文effect,提出了一種用於自然場景文本檢測的像素錨框架。 論文發表前,由國際文檔分析與識別大會發布的像素錨算法在icdar2015和icdar2017mlt數據集上進行了測試,刷新了icdar2015的最佳結果。 據悉,icdar2015純英文文本檢測數據集。 Icdar2017mlt包含拉丁語、英語、漢語、韓語、日語和阿拉伯語等九種語言。 雲聰的像素錨算法在icdar2017mlt綜合榜單中排名第四,排名前三的國家沒有公開論文被國外機構提交。
自然場景文本檢測可以應用在更廣闊的領域,但與傳統的文本檢測相比,OCR文本檢測和識別在各種商品中,自然場景中的集合或自然場景圖片面臨複雜的背景干擾、文本模糊和退化、不可預測的光照、字體多樣性、垂直文本和傾斜文本車牌識別系統針對高質量的文檔圖像進行了比較,例如照片分析,車牌識別,圖像廣告過濾,場景理解,商品識別,街景定位,賬單識別等。