Le logiciel de numérisation de cartes de visite du système de reconnaissance de plaques d'immatriculation de nombreux téléphones intelligents a cette fonction. Le 20 novembre 2018, la reconnaissance optique de caractères (ci-après dénommée OCR) fait référence au processus d'analyse des images pour obtenir des informations textuelles. L'ensemble de test de la Conférence internationale sur l'analyse et la reconnaissance des documents (ICDAR), un indicateur important dans le domaine de l'OCR, a de nouveau été actualisé. Les universités et entreprises chinoises classées parmi les cinq premières de l'ICDAR 2015, suivies par l'Université de Nanjing et l'Université de technologie de Nanjing (psenet masktext, fot) Alibaba (inceptext) se concentre sur la reconnaissance et l'application de texte. Afin d'améliorer le niveau de détection et de reconnaissance de texte des scènes naturelles, la Conférence internationale sur l'analyse et la reconnaissance de documents est l'une des conférences professionnelles organisées par la Société internationale de reconnaissance de formes (IAPR). La Conférence internationale sur l'analyse et la reconnaissance des documents (ICDAR a établi un solide concours de lecture de texte en 2003 (robustradecompetition a jusqu'à présent impliqué plus de 3500 équipes de 89 pays.
Google microsoftamazon Facebook, Université de Pékin, Université des sciences et technologies de Chine, Tencent, Sogou, etc. Y ont participé. Les résultats peuvent être soumis à tout moment et l'ensemble de données de test du concours robuste de lecture de texte a été publié en ligne. L'ensemble de données de test de l'algorithme de test dans l'industrie de la détection de texte de scène naturelle. ICDAR 2015 et icdar2017mlt sont deux sous-ensembles de test. Cdar2015 et icdar2017mlt sont des ensembles de données faisant autorité dans le domaine de la détection de texte de scène naturelle. Des nouvelles en plein essor ont interviewé la technologie cloud Cong, qui occupe actuellement le premier rang de la liste icdar2015. Li Yuan, un ingénieur algorithme de l'Institut des sciences et de la technologie, l'a introduit. Fondamentalement, tous les articles seront détectés dessus "est aussi la base du classement. Liste Cdar2015 (20 novembre 2018) la valeur de F représente la moyenne harmonique de précision et de taux de détection. Plus la valeur de F est grande, meilleur est le résultat de la détection.
La précision représente la proportion de texte correct dans le résultat de détection; taux de détection (le recal reflète le rapport entre le texte détecté et le nombre total de texte d'image, ce qui explique la liste pour le journaliste. Cela peut refléter si le texte a été manqué. Afin de détecter l'effet de l'algorithme, le système de reconnaissance des plaques d'immatriculation doit prendre en compte de manière exhaustive la précision et le taux de détection, et la valeur F représente simplement la moyenne harmonique de la précision et du taux de détection, qui est également la base du classement. Le premier n'a pas la fonction de reconnaître le texte, il doit donc être noté Cela signifie que la détection de texte de scène naturelle mentionnée ici n'est pas équivalente à la reconnaissance de texte. Cela signifie détecter le texte en images.
Le 20 novembre 2018, a déclaré Li Yuan. La technologie Yuncong a publié le dernier effet papier sur le site Web de pré-impression arXiv, qui proposait un cadre d'ancrage de pixels pour la détection de texte de scène naturelle. Avant la publication de l'article, il a été publié par la Conférence internationale sur l'analyse et la reconnaissance de documents L'algorithme d'ancrage de pixels a été testé sur des ensembles de données icdar2015 et icdar2017mlt, et les meilleurs résultats de l'icdar2015 ont été actualisés. Il est rapporté que l'ensemble de données de détection de texte en anglais pur icdar2015. Icdar2017mlt contient neuf langues telles que le latin, l'anglais, le chinois, le coréen, le japonais et l'arabe. L'algorithme d'ancrage de pixels de Yuncong se classe quatrième dans la liste complète d'icdar2017mlt et les trois premiers pays Aucun document public n'a été soumis par des institutions étrangères.
La détection de texte de scène naturelle peut être appliquée dans un domaine plus large, mais par rapport à la détection de texte traditionnelle, la détection et la reconnaissance de texte OCR dans divers produits, décors ou images de scènes naturelles dans des scènes naturelles, face à des interférences de fond complexes, flou et dégradation de texte, éclairage imprévisible, diversité de police, Texte vertical et texte incliné Le système de reconnaissance des plaques d'immatriculation est comparé à l'OCR conservateur pour les images de documents de haute qualité, telles que l'analyse de photos, la reconnaissance des plaques d'immatriculation, le filtrage de la publicité d'image, la compréhension des scènes, la reconnaissance des produits, le positionnement de la vue de rue, la reconnaissance des factures, etc.
Technologie Cie., Ltd de Shenzhen TigerWong
Tel:86 13717037584
E-mail: info@sztigerwong.com
Ajouter : 1er étage, bâtiment A2, parc industriel numérique de Silicon Valley Power, No. 22 route Dafu, rue Guanlan, district de Longhua,
Shenzhen, province du Guangdong, Chine