Thường được gọi là giấy phép mảng công nhận hệ thống, quang học công nhận nhân vật, giới thiệu cho nhân vật công nhận, nhân vật công nhận. Đầy đủ Tiếng Anh tên là quang học nhỏ gọn công nhận, hoặc OCR. Nó sử dụng công nghệ quang học và công nghệ máy tính để đọc và nhận ra in hoặc viết tay nhân vật và chuyển đổi chúng thành một định dạng có thể được đọc bởi các máy tính và con người. OCR công nghệ là một chìa khóa liên kết ở đây. Trong OCR công nghệ, in nhân vật công nhận là trưởng thành nhất một, bởi vì nó lần đầu tiên được phát triển. Đầu năm 1929, nó đã được sử dụng bởi nước Châu Âu và Mỹ để đối phó với một số lượng lớn của báo và Tạp Chí, tài liệu, tài liệu và báo cáo.
Sau hơn 40 năm phát triển và cải tiến, nhân vật công nghệ nhận dạng đã trở thành ngây thơ và dần dần nhận ra "electronization của xử lý thông tin". Tuy nhiên, các nghiên cứu trên in Trung Quốc công nhận nhân vật trong Trung Quốc bắt đầu vào cuối những năm 1970S và có một phát triển Lịch Sử của gần 30 năm. Nó có thể được's Khoảng chia thành các sau đây ba giai đoạn: giai đoạn 1. Thăm dò Sân Khấu (trên cơ sở của các nghiên cứu về công nhận của con số, tiếng Anh và tiếng biểu tượng từ 1979-1985, kể từ khi vào cuối những năm 1970S, các nhà nghiên cứu từ một vài đơn vị tại Trung Quốc có khám phá các phương pháp của nhân vật Trung Quốc công nhận, được công bố một số giấy tờ và phát triển một số lượng nhỏ của Analog phần mềm nhận dạng và hệ thống. Giai đoạn này là dài và ít có tác dụng, nhưng nó có bred hiệu quả trái cây trong các tiếp theo sân khấu. 2 R & D giai đoạn (từ 1986-1988, ba năm từ đầu của 1986 để kết thúc của 1988 là đỉnh cao của các nghiên cứu trên nhân Vật Trung Quốc công nghệ nhận dạng và thu hoạch của các nghiên cứu trên in nhân vật Trung Quốc công nghệ nhận dạng. MỘT tổng cộng 11 đơn vị tiến hành 14 đánh giá trên các hiệu ứng của in nhân vật Trung Quốc công nhận. Các hệ thống này có thể đạt được chỉ số cho mẫu tấm công nhận: họ có thể nhận ra Bài Hát kiểu chữ, giả Bài Hát kiểu chữ, Bold kiểu chữ và thường xuyên kiểu chữ, và các số từ được công nhận có thể đạt 6763 lúc nhất, các tỉ lệ nhận dạng font chữ kích thước từ Không Có. 3 để Không Có. 5 là hơn 99.5%, và công nhận tốc độ có thể đạt 10 14 từ/S dưới các điều kiện của 286 Máy tính siêu nhỏ, nhưng các công nhận tỷ lệ của thực văn bản được giảm đáng kể, mà là do sự thay đổi của văn bản in hình dạng (chẳng hạn như văn bản mờ, đột quỵ độ bám dính, bị phá vỡ bút, Không đồng đều màu đen và trắng, người nghèo chất lượng giấy, mực in phản ánh, vv) của các bên trên hệ thống Kém khả năng thích ứng và chống nhiễu, nhưng các Hệ thống nhận dạng phát triển trong Quá Khứ ba năm có đặt một nền tảng cho các khả thi của in Trung Quốc nhân vật công nhận hệ thống, và các hệ thống nhận dạng phải đi qua các quá trình từ phát triển để tính thực tiễn. 3. In Trung Quốc công nhận Nhân Vật (nhân vật công nhận) trong thực tế Sân Khấu (từ năm 1989 đến nay) kể từ khi đỉnh cao của nó trong năm 1986, các Bộ Phận của kỹ thuật điện tử của Tsinghua Đại Học, thông minh trung tâm của các Viện của máy tính của Trung Quốc Học Viện của Khoa Học, bắc Kinh Viện của Thông tin kỹ thuật, Thẩm Dương Viện của tự động hóa và các đơn vị khác đã phát triển và phát triển thực tế in nhân vật Trung Quốc công nhận hệ thống, đặc biệt là các Tsinghua TH OCR Sản phẩm được phát triển bởi các Bộ Phận của kỹ thuật điện tử của Tsinghua Trường Đại Học và các Shangshu OCR sản phẩm được phát triển bởi Hanwang nhóm, Nó có đã luôn luôn được ở vị trí hàng đầu của công nghệ phát triển và chiếm các lớn nhất thị trường chia sẻ, đại diện cho các xu hướng phát triển của in nhân vật Trung Quốc công nghệ nhận dạng.
Hiện nay, các nghiên cứu tập trung của in nhân vật Trung Quốc công nghệ nhận dạng có chuyển từ nhân vật đơn giản nhận dạng tự động hình thức công nhận và đầu vào, bố trí phân tích, bố trí sự hiểu biết và bố trí phục hồi của hỗn hợp đồ họa và đa ngôn ngữ bố trí, thẻ kinh doanh công nhận, tài Chính hóa đơn nhận dạng và cuốn sách cổ nhận dạng, và trình bày nhiều liên quan xác định hệ thống, Chẳng hạn như thẻ kinh doanh Hệ thống nhận dạng, ID thẻ Hệ thống nhận dạng và "Huishi" đưa ra bởi Zhong'an tương lai Công nghệ Màn Hình nhân vật và nhận dạng hình ảnh hệ thống, vv. Các bài thuyết trình của những mới công nhận hệ thống đánh dấu một rộng mở rộng của các lĩnh vực ứng dụng của in Trung Quốc công nhận nhân vật công nghệ. Tổng quan về các nhận dạng OCR quy trình làm việc của Zhongan tương lai công nghệ. Mục đích của nhận dạng OCR hệ thống là rất đơn giản. Các hình ảnh được chuyển đổi để giữ cho đồ họa trong các hình ảnh. Nếu có là một hình thức, các dữ liệu trong các hình thức và các nhân vật trong các hình ảnh, một nhận dạng OCR quá trình phân tích 1. Hình ảnh đầu vào và tiền xử lý: 2. Hình ảnh đầu vào: Đối với khác nhau hình ảnh định dạng, có khác nhau các định dạng lưu trữ và khác nhau nén phương pháp.
Tiền xử lý: chủ yếu là bao gồm hai phần Binarization: Hầu hết các hình ảnh được chụp bởi các máy ảnh màu đen hình ảnh, có chứa một số tiền rất lớn của thông tin. Các nội dung của các hình ảnh có thể được chỉ đơn giản là được chia thành nền trước và nền. Trong đặt hàng để làm cho máy tính nhận ra nhân vật nhanh hơn và tốt hơn, nó là cần thiết để xử lý các hình ảnh màu đen đầu tiên, và chỉ giữ nền trước thông tin và thông tin nền trước Thông tin là màu đen và các thông tin là màu trắng, mà là nhị phân hình ảnh. 4. Loại bỏ tiếng ồn: Đối với khác nhau tài liệu, các định nghĩa của khô có thể được khác nhau. Theo các đặc tính của khô, các giấy phép mảng công nhận hệ thống được gọi là loại bỏ tiếng ồn. 5. Chính xác độ nghiêng: bởi vì người dùng bình thường là nhiều hơn bình thường khi dùng hình ảnh của tài liệu, các hình ảnh được chụp có thể không được ngăn chặn Trong trường hợp của nghiêng, các nhân vật phần mềm nhận dạng là cần thiết để sửa chữa nó. 6. Bố trí phân tích: Phân tích các quá trình của phân chia tài liệu hình ảnh vào đoạn và chi nhánh được gọi là bố trí phân tích. Do sự đa dạng và phức tạp của thực tế tài liệu, có là không cố định tối ưu mô hình cắt hiện nay. 7. Nhân vật cắt: Do sự hạn chế của chụp ảnh điều kiện, nó thường xuyên gây ra nhân vật độ bám dính và bút vỡ, vì vậy nó là vô cùng giới hạn Để cải thiện hiệu suất của các hệ thống nhận dạng, nó là cần thiết cho các nhân vật phần mềm nhận dạng để có các nhân vật chức năng cắt. 8. Công nhận nhân vật: Đây nghiên cứu là rất sớm.
Có mẫu phù hợp cho một thời gian dài. Sau đó, nó tập trung vào tính năng khai thác. Do để các ảnh hưởng của văn bản chuyển, đột quỵ độ dày, bị phá vỡ bút, độ bám dính, xoay và các yếu tố khác, nó bị ảnh hưởng rất nhiều các khó khăn của tính năng khai thác. 9. Bố trí phục hồi: người Nó là Hy vọng rằng các được công nhận văn bản vẫn sẽ được sắp xếp giống như bản gốc tài liệu hình ảnh, và các đoạn văn, vị trí và đơn đặt hàng sẽ vẫn không thay đổi. Quá trình này được gọi là bố trí phục hồi. 10. Xử lý bài viết và Hiệu đính: chính xác Công Nhận kết quả theo các mối quan hệ của ngôn ngữ cụ thể bối cảnh, mà là Post-chế biến. Các hiện tại nhận dạng OCR công nghệ đã được thành công áp dụng cho sinh viên cho một thời gian dài Tất Cả Các khía cạnh của cuộc sống: chẳng hạn như các tất cả-Trong-Một giấy phép mảng công nhận máy tại các lối vào và lối ra của các cộng đồng, các Ngân Hàng thẻ nhận dạng được sử dụng cho tài khoản ngân hàng mở, các doanh nghiệp thẻ nhận dạng công cụ cho thẻ kinh doanh quản lý, vv. Nhận dạng OCR công nghệ là ảnh hưởng đến cuộc sống của tôi.
Có hệ thống giới thiệu sự phát triển lịch sử của công nhận nhân vật: đầu tiên, nhân vật công nhận là một của các chi nhánh trong các lĩnh vực của máy tính tầm nhìn nghiên cứu. Giấy này là một chuyên nghiệp giấy trên giấy phép mảng công nhận hệ thống MỘT cao thông tin bài viết. Nó thuộc về mô hình công nhận và trí thông minh nhân tạo, một phần quan trọng của khoa học máy tính. Xin vui lòng thực hiện theo các bài luận để xem của nó phát triển.
Thâm quyến TigerWong Công Nghệ Co., LTD
Tel:86 13717037584
E-mail: info@sztigerwong.com
Địa chỉ: Tầng 1, Tòa nhà A2, Khu công nghiệp kỹ thuật số Silicon Valley Power, số 1. 22 Đường Dafu, Phố Guanlan, Quận Long Hoa,
Thâm Quyến, tỉnh Quảng Đông, Trung Quốc