Comumente conhecido como sistema de reconhecimento de placas, reconhecimento óptico de caracteres, introdução ao reconhecimento de caracteres, reconhecimento de caracteres. O nome completo em inglês é reconhecimento óptico compacto ou OCR. Ele usa tecnologia óptica e tecnologia de computador para ler e reconhecer caracteres impressos ou escritos à mão e convertê-los em um formato que pode ser lido por computadores e pessoas. A tecnologia OCR é um link chave aqui. Na tecnologia OCR, o reconhecimento de caracteres impressos é o mais maduro, porque foi desenvolvido pela primeira vez. Já em 1929, era usado por países europeus e americanos para lidar com um grande número de jornais e revistas, documentos, documentos e declarações.
Após mais de 40 anos de desenvolvimento e melhoria, a tecnologia de reconhecimento de caráter tornou-se mais ingênua e gradualmente percebeu a "eletronização do processamento de informações". No entanto, a pesquisa sobre o reconhecimento de caracteres chineses impressos na China começou no final dos anos 1970 e tem uma história de desenvolvimento de quase 30 anos. Pode ser dividido aproximadamente nos seguintes três estágios: 1. Estágio de exploração (com base na pesquisa sobre o reconhecimento de números, inglês e símbolos de 1979 a 1985, desde o final dos anos 1970, pesquisadores de algumas unidades na China exploraram os métodos de reconhecimento de caracteres chineses, publicaram alguns artigos e desenvolveram um pequeno número de software e sistemas de reconhecimento analógico. Este estágio é longo e tem pouco efeito, mas gerou frutos frutíferos no próximo estágio. 2 R & Estágio D (de 1986 a 1988, os três anos do início de 1986 ao final de 1988 foram o clímax da pesquisa sobre tecnologia de reconhecimento de caracteres chineses e a colheita da pesquisa sobre tecnologia de reconhecimento de caracteres chineses impressos. Um total de 11 unidades realizaram 14 avaliações sobre o efeito do reconhecimento de caracteres chineses impressos. Esses sistemas podem alcançar altos indicadores para reconhecimento de folha de amostra: eles podem reconhecer o tipo de letra Song, tipo de letra de imitação Song, fonte em negrito e fonte regular, e o número de palavras reconhecidas pode chegar a 6763 no máximo. A taxa de reconhecimento de tamanhos de fonte de No. 3 a No. 5 é mais de 99,5%, e a velocidade de reconhecimento pode chegar a 10 14 palavras/s sob a condição de 286 microcomputador, mas a taxa de reconhecimento de texto real é bastante reduzida, o que é devido à mudança de forma de texto impresso (como desfocagem de texto, adesão de curso, caneta quebrada, Desigual em preto e branco, baixa qualidade do papel, reflexão da tinta, etc.) do sistema acima Má adaptabilidade e anti-interferência, mas o sistema de reconhecimento desenvolvido nos últimos três anos estabeleceu uma base para a praticabilidade do sistema de reconhecimento de caracteres chineses impressos, e o sistema de reconhecimento deve passar pelo processo do desenvolvimento à praticidade. 3. Reconhecimento de caracteres chineses impressos (reconhecimento de caracteres) na fase prática (de 1989 até agora) Desde o seu clímax em 1986, o Departamento de engenharia eletrônica da Universidade de Tsinghua, o centro inteligente do Instituto de computação da Academia Chinesa de Ciências, Instituto de Pequim de engenharia da informação, O Instituto Shenyang de automação e outras unidades desenvolveram e desenvolveram sistemas práticos de reconhecimento de caracteres chineses impressos, especialmente o produto OCR Tsinghua, desenvolvido pelo Departamento de Engenharia Eletrônica da Universidade de Tsinghua e o produto OCR Shangshu desenvolvido pelo grupo Hanwang, Sempre esteve na vanguarda do desenvolvimento tecnológico e ocupa a maior participação de mercado, representando a tendência de desenvolvimento da tecnologia de reconhecimento de caracteres chineses impressos.
Atualmente, o foco de pesquisa da tecnologia de reconhecimento de caracteres chineses impressos mudou de reconhecimento de caracteres simples para reconhecimento e entrada automática de formulários, análise de layout, compreensão de layout e recuperação de layout de layout gráfico misto e multilíngue, reconhecimento de cartão de visita, identificação de contas financeiras e identificação de livros antigos, e apresenta muitos sistemas de identificação relacionados, Como sistema de identificação de cartão de visita, sistema de identificação de cartão de identificação e "Huishi" lançado pela tecnologia futura Zhong'an Sistema de reconhecimento de imagem e personagem de tela, etc. A apresentação desses novos sistemas de reconhecimento marca uma ampla expansão do campo de aplicação da tecnologia de reconhecimento de caracteres chineses impressos. Visão geral do fluxo de trabalho de reconhecimento OCR da tecnologia futura de Zhongan. O objetivo do sistema de reconhecimento OCR é muito simples. A imagem é convertida para manter os gráficos na imagem. Se houver um formulário, os dados no formulário e os caracteres na imagem, uma análise de processo de reconhecimento OCR 1. Entrada de imagem e pré-processamento: 2. Entrada de imagem: para diferentes formatos de imagem, existem diferentes formatos de armazenamento e diferentes métodos de compressão.
Pré-processamento: inclui principalmente duas partes Binarização: a maioria das fotos tiradas pela câmera são imagens pretas, que contêm uma enorme quantidade de informações. O conteúdo da imagem pode ser simplesmente dividido em primeiro plano e fundo. Para que o computador reconheça os caracteres mais rápido e melhor, é necessário processar a imagem preta primeiro e manter apenas as informações de primeiro plano e as informações de fundo. As informações de primeiro plano são pretas e as informações de fundo são brancas, que são a imagem binária. 4. Remoção de ruído: para documentos diferentes, a definição de secura pode ser diferente. De acordo com as características da secura, o sistema de reconhecimento da placa é chamado de remoção de ruído. 5. Inclinação correta: porque os usuários comuns são mais casuais ao tirar fotos de documentos, as fotos tiradas não podem ser evitadas Em caso de inclinação, o software de reconhecimento de caracteres é necessário para corrigi-lo. 6. Análise de layout: o processo de dividir as imagens dos documentos em parágrafos e ramificações é chamado de análise de layout. Devido à diversidade e complexidade dos documentos reais, não existe um modelo de corte ideal fixo no momento. 7. Corte de caracteres: devido à limitação das condições de fotografia, muitas vezes causa adesão de caracteres e quebra de caneta, por isso é extremamente limitado Para melhorar o desempenho do sistema de reconhecimento, é necessário que o software de reconhecimento de caracteres tenha a função de corte de caracteres. 8. Reconhecimento de caráter: esta pesquisa é muito cedo.
Houve correspondência de modelos por um longo tempo. Mais tarde, ele se concentrou na extração de recursos. Devido à influência do deslocamento do texto, espessura do curso, caneta quebrada, adesão, rotação e outros fatores, afetou muito a dificuldade de extração de recursos. 9. Restauração de layout: Pessoas Espera-se que o texto reconhecido ainda seja organizado como as imagens do documento original, e os parágrafos, posições e ordem permanecerão inalterados. Este processo é chamado de restauração de layout. 10. Pós-processamento e revisão: corrigir os resultados do reconhecimento de acordo com a relação do contexto de linguagem específica, que é o pós-processamento. A atual tecnologia de reconhecimento de OCR foi aplicada com sucesso aos alunos por um longo tempo. Todos os aspectos da vida: como a máquina de reconhecimento de placas tudo-em-um na entrada e saída da comunidade, o reconhecimento de cartão bancário usado para abertura de conta bancária, a ferramenta de reconhecimento de cartão de visita para gerenciamento de cartão de visita, etc. A tecnologia de reconhecimento de OCR está afetando minha vida.
Introduzir sistematicamente o histórico de desenvolvimento do reconhecimento de caracteres: primeiro, o reconhecimento de caracteres é um dos ramos no campo da pesquisa em visão computacional. Este artigo é um artigo profissional sobre sistema de reconhecimento de placas de veículos Um artigo altamente informativo. Pertence ao reconhecimento de padrões e inteligência artificial, uma parte importante da ciência da computação. Por favor, siga o ensaio para ver seu desenvolvimento.
Tecnologia Co. de Shenzhen TigerWong, Ltd
Tel:86 13717037584
O email: info@sztigerwong.com
Adicionar: 1º Andar, Edifício A2, Silicon Valley Power Digital Industrial Park, No. Estrada Dafu 22, Rua Guanlan, Distrito de Longhua,
Shenzhen, província de Guangdong, China