Il software di scansione dei biglietti da visita del sistema di riconoscimento delle targhe in molti telefoni intelligenti ha questa funzione. Il 20 novembre 2018, il riconoscimento ottico dei caratteri (di seguito denominato OCR) si riferisce al processo di analisi delle immagini per ottenere informazioni di testo. Il set di test della Conferenza internazionale di analisi e riconoscimento dei documenti (ICDAR), un indicatore importante nel campo dell'OCR, è stato nuovamente aggiornato. Le università e le imprese cinesi si sono classificate tra le prime cinque nell'ICDAR 2015, seguite dall'ancora di pixel dell'Università di Nanchino e dall'Università di tecnologia di Nanchino (psenet masktext, fot) Alibaba (inceptext) si concentra sul riconoscimento e l'applicazione del testo. Al fine di migliorare il rilevamento del testo e il livello di riconoscimento delle scene naturali, la Conferenza internazionale sull'analisi e il riconoscimento dei documenti è una delle conferenze professionali organizzate dalla Società internazionale di riconoscimento dei modelli (IAPR). La Conferenza internazionale sull'analisi e il riconoscimento dei documenti (ICDAR ha istituito un solido concorso per la lettura di testi nel 2003 (il robustradecompetition ha finora coinvolto più di 3500 team provenienti da 89 paesi.
Google microsoftamazon Facebook, Università di Pechino, Università di scienza e tecnologia della Cina, Tencent, Sogou, ecc. Vi hanno partecipato. I risultati possono essere presentati in qualsiasi momento e il set di dati di test di un solido concorso per la lettura di testi è stato pubblicato online. Il set di dati di test dell'algoritmo di test nell'industria del rilevamento del testo di scena naturale. ICDAR 2015 e icdar2017mlt sono due sottoinsiemi di test. Cdar2015 e icdar2017mlt sono set di dati autorevoli nel campo del rilevamento del testo di scena naturale. Notizie in aumento intervistate dalla tecnologia cloud Cong, che attualmente è al primo posto nell'elenco icdar2015. Li Yuan, un ingegnere di algoritmi dell'Istituto di scienza e tecnologia, lo ha introdotto. In sostanza, tutti gli articoli saranno rilevati su di esso "è anche la base della classifica. Cdar2015 list (20 novembre 2018) il valore di F rappresenta la media armonica di precisione e tasso di rilevamento. Maggiore è il valore di F, migliore è il risultato del rilevamento.
La precisione rappresenta la proporzione del testo corretto nel risultato del rilevamento; tasso di rilevamento (il ricalino riflette il rapporto tra il testo rilevato e il numero totale di testo dell'immagine, che spiega l'elenco per il reporter. Può riflettere se il testo è stato perso. Al fine di rilevare l'effetto dell'algoritmo, il sistema di riconoscimento della targa deve considerare in modo completo l'accuratezza e il tasso di rilevamento, e il valore F rappresenta solo la media armonica dell'accuratezza e del tasso di rilevamento, che è anche la base per la classificazione. Il primo non ha la funzione di riconoscere il testo, quindi deve essere notato Significa che il rilevamento del testo di scena naturale menzionato qui non è equivalente al riconoscimento del testo. Significa rilevare il testo nelle immagini.
Il 20 novembre 2018, ha detto Li Yuan. La tecnologia Yuncong ha pubblicato l'ultimo effetto cartaceo sul sito Web di preprint arXiv, che proponeva un framework di ancoraggio dei pixel per il rilevamento del testo della scena naturale. Prima che il documento fosse pubblicato, è stato rilasciato dalla Conferenza internazionale sull'analisi e il riconoscimento dei documenti L'algoritmo di ancoraggio dei pixel è stato testato su set di dati icdar2015 e icdar2017mlt ei migliori risultati di icdar2015 sono stati aggiornati. È stato riferito che il set di dati di rilevamento del testo in inglese puro icdar2015. Icdar2017mlt contiene nove lingue come latino, inglese, cinese, coreano, giapponese e arabo. L'algoritmo di ancoraggio dei pixel di Yuncong è al quarto posto nell'elenco completo di icdar2017mlt e nei primi tre paesi Nessun documento pubblico è stato presentato da istituzioni straniere.
Il rilevamento del testo di scena naturale può essere applicato in un campo più ampio, ma confrontato con il rilevamento del testo tradizionale, il rilevamento e il riconoscimento del testo OCR in vari prodotti, set o immagini di scene naturali in scene naturali devono affrontare interferenze di sfondo complesse, sfocatura e degrado del testo, illuminazione imprevedibile, diversità di caratteri, Testo verticale e testo inclinato Il sistema di riconoscimento della targa viene confrontato con l'OCR conservativo per immagini documentali di alta qualità, come analisi fotografica, riconoscimento della targa, filtraggio della pubblicità dell'immagine, comprensione della scena, riconoscimento dei prodotti, posizionamento della vista stradale, riconoscimento della fattura, ecc.
Tecnologia Co.,Ltd di Shenzhen TigerWong
Tel:86 13717037584
E-mail: info@sztigerwong.com
Aggiungi: 1° piano, edificio A2, parco industriale digitale Silicon Valley Power, n. 22 Dafu Road, Guanlan Street, distretto di Longhua,
Shenzhen, provincia di Guangdong, Cina