Обычно известная как система распознавания номерных знаков, оптическое распознавание символов, введение в распознавание символов, распознавание символов. Полное английское название-оптическое компактное распознавание или OCR. Он использует оптические технологии и компьютерные технологии для чтения и распознавания печатных или рукописных символов и преобразования их в формат, который могут быть прочитаны компьютерами и людьми. Технология OCR является ключевым звеном здесь. В технологии OCR распознавание печатных символов является наиболее зрелым, потому что оно было впервые разработано. Еще в 1929 году он использовался европейскими и американскими странами для работы с большим количеством газет и журналов, документов, документов и заявлений.
После более чем 40-летнего развития и совершенствования технология распознавания персонажей стала более наивной и постепенно реализовала «электронизацию обработки информации». Однако исследования распознавания печатных китайских символов в Китае начались в конце 1970-х годов и имеют почти 30-летнюю историю развития. Его можно условно разделить на следующие три этапа: 1. Этап исследования (на основе исследований распознавания чисел, английского языка и символов с 1979 по 1985 год, с конца 1970-х годов, исследователи из нескольких единиц в Китае изучили методы распознавания китайских символов, опубликовали некоторые статьи и разработали небольшое количество программного обеспечения и систем аналогового распознавания. Этот этап длинный и мало влияет, но он породил плодоносные плоды на следующем этапе. 2 R & Этап D (с 1986 по 1988 год, три года с начала 1986 года до конца 1988 года были кульминацией исследований китайской технологии распознавания символов и урожаем исследований технологии распознавания печатных китайских символов. В общей сложности 11 единиц провели 14 оценок влияния распознавания печатных китайских иероглифов. Эти системы могут достигать высоких показателей для распознавания листов образцов: они могут распознавать шрифт Song, шрифт имитации Song, шрифт жирного шрифта и обычный шрифт, а количество распознанных слов может достигать не более 6763. Скорость распознавания размеров шрифта от No. 3 к No. 5 составляет более 99,5%, а скорость распознавания может достигать 10 14 слов/с при условии 286 микрокомпьютера, но скорость распознавания реального текста значительно снижается, что связано с изменением формы печатного текста (например, размытие текста, адгезия хода, сломанная ручка, Неравномерное черно-белое, плохое качество бумаги, отражение чернил и т. д.) вышеуказанной системы Плохая адаптивность и защита от помех, но система распознавания, разработанная за последние три года, заложила основу для практичности печатной китайской системы распознавания символов, и система признания должна пройти процесс от разработки к практичности. 3. Печатное распознавание китайских символов (распознавание символов) на практической стадии (с 1989 года по настоящее время) С момента своего апогея в 1986 году факультет электронной инженерии Университета Цинхуа, интеллектуального центра Института вычислительной техники Китайской академии наук, Пекинский институт информационной инженерии, Шэньянский институт автоматизации и другие подразделения разработали и разработали практические печатные китайские системы распознавания символов, особенно продукт Tsinghua th OCR, разработанный Департаментом электронной инженерии Университета Цинхуа, и продукт Shangshu OCR, разработанный группой Hanwang. Он всегда был на переднем крае технологического развития и занимает самую большую долю рынка, представляя тенденцию развития технологии распознавания печатных китайских символов.
В настоящее время исследовательский фокус технологии распознавания печатных китайских символов сместился с простого распознавания символов на автоматическое распознавание и ввод форм, анализ макета, понимание макета и восстановление макета смешанного графического и многоязычного макета, распознавание визитных карточек, идентификацию финансовых счетов и древнюю книгу. идентификация, и представляет множество связанных систем идентификации, Такие как система идентификации визитных карточек, система идентификации удостоверений личности и "Huishi", запущенная компанией Zhong'an, будущая технология Screen character и система распознавания изображений и т. д. Презентация этих новых систем распознавания знаменует собой широкое расширение области применения технологии распознавания печатных китайских символов. Обзор рабочего процесса распознавания OCR технологии будущего Zhongan. Цель системы распознавания OCR очень проста. Изображение преобразуется, чтобы сохранить графику в изображении. Если есть форма, данные в форме и символы на изображении, один анализ процесса распознавания OCR 1. Вход изображения и предварительная обработка: 2. Ввод изображения: для разных форматов изображений существуют разные форматы хранения и разные методы сжатия.
Предварительная обработка: в основном включает две части Бинаризация: большинство снимков, сделанных камерой, представляют собой черные изображения, которые содержат огромное количество информации. Содержание картины можно просто разделить на передний план и фон. Чтобы компьютер распознавал персонажей быстрее и лучше, необходимо сначала обработать черное изображение и сохранить только информацию переднего плана и фоновую информацию. Информация переднего плана черная, а фоновая информация белая, то есть двоичное изображение. 4. Удаление шума: для разных документов определение сухости может быть разным. В соответствии с характеристиками сухости система распознавания номерных знаков называется снятием шума. 5. Правильная склонность: поскольку обычные пользователи более случайны при фотографировании документов, сделанные фотографии не могут быть предотвращены. В случае перекоса требуется программное обеспечение для распознавания символов, чтобы исправить это. 6. Анализ компоновки: процесс разделения картинок документа на абзацы и ветви называется анализом макета. Из-за разнообразия и сложности фактических документов в настоящее время нет фиксированной оптимальной модели резки. 7. Резка персонажа: из-за ограничения условий фотографирования она часто вызывает адгезию персонажа и поломку пера, поэтому она чрезвычайно ограничена. Для улучшения производительности системы распознавания необходимо, чтобы программное обеспечение распознавания персонажей могло выполнять функцию резки персонажа. 8. Распознавание характера: это исследование очень раннее.
Давно было сопоставление шаблонов. Позже он сосредоточился на извлечении функций. Из-за влияния смещения текста, толщины штриха, сломанной ручки, адгезии, вращения и других факторов это сильно повлияло на сложность извлечения элементов. 9. Восстановление макета: люди Есть надежда, что распознанный текст по-прежнему будет располагаться как исходные изображения документа, а абзацы, позиции и порядок останутся неизменными. Этот процесс называется реставрацией макета. 10. Пост-обработка и корректура: исправьте результаты распознавания в соответствии с зависимостью конкретного языкового контекста, который является постобработкой. Текущая технология распознавания OCR успешно применяется для студентов в течение длительного времени Все аспекты жизни: такие как универсальная машина распознавания номерных знаков на входе и выходе из сообщества, распознавание банковской карты, используемое для открытия банковского счета, инструмент распознавания визитных карточек для управления визитными картами и т. д. Технология распознавания OCR влияет на мою жизнь.
Систематически вводить историю развития распознавания персонажей: во-первых, распознавание персонажей является одним из ответвлений в области исследований компьютерного зрения. Эта статья представляет собой профессиональную статью о системе распознавания номерных знаков. Очень информативная статья. Он принадлежит к распознаванию образов и искусственному интеллекту, важной части информатики. Следите за эссе, чтобы увидеть его развитие.
Шэньчжэнь TigerWong Technology Co.,Ltd
Тел:86 13717037584
Электронная почта: info@sztigerwong.com
Добавить: 1-й этаж, здание А2, Индустриальный парк Silicon Valley Power Digital, № 1. улица Дафу, 22, улица Гуанлан, район Лунхуа,
Шэньчжэнь, провинция Гуандун, Китай