loading

Phát triển công nghệ nhận dạng khuôn mặt_ Taigewang

Quy trình cổ điển của nhận dạng khuôn mặt tự động được chia thành ba bước: nhận diện khuôn mặt, định vị điểm đặc trưng của khuôn mặt (còn được gọi là căn chỉnh khuôn mặt), trích xuất đặc điểm và thiết kế bộ phân loại. Nói chung, nhận dạng khuôn mặt theo nghĩa hẹp đề cập đến & quot; Bộ phân loại trích xuất tính năng & quot; Hai phần của nghiên cứu thuật toán. Trước khi xuất hiện học sâu, các phương pháp nhận dạng khuôn mặt thường được chia thành hai bước: khai thác đặc điểm nhân tạo chiều cao (như LBP, Gabor, v.v.) và giảm kích thước. Các phương pháp giảm kích thước đại diện bao gồm các phương pháp học tập không gian con như PCA và LDA và các phương pháp học tập phổ biến như LPP. Sau sự phổ biến của phương pháp học sâu, phương pháp đại diện là học trực tiếp biểu diễn mặt phân biệt từ không gian ảnh gốc. Nói chung, lịch sử nghiên cứu về nhận dạng khuôn mặt có thể được chia thành ba giai đoạn. Trong giai đoạn đầu (những năm 1950-1980), nhận dạng khuôn mặt được coi là một bài toán nhận dạng khuôn mẫu chung. Công nghệ chính dựa trên cấu trúc hình học của khuôn mặt. Trong giai đoạn thứ hai (những năm 1990), nhận dạng khuôn mặt phát triển nhanh chóng, và nhiều phương pháp cổ điển đã xuất hiện, chẳng hạn như eigenface, khuôn mặt Fisher và đối sánh đồ thị đàn hồi. Tại thời điểm này, lộ trình kỹ thuật chủ đạo là mô hình hóa khuôn mặt rõ ràng. Trong giai đoạn thứ ba (từ cuối những năm 1990 đến nay), các nghiên cứu về nhận dạng khuôn mặt ngày càng đi vào chiều sâu. Các nhà nghiên cứu bắt đầu chú ý đến nhận dạng khuôn mặt trong điều kiện thực tế, chủ yếu bao gồm bốn khía cạnh sau: 1) đề xuất các mô hình không gian khuôn mặt khác nhau, bao gồm phương pháp mô hình tuyến tính được biểu diễn bằng phân tích phân biệt tuyến tính, phương pháp mô hình phi tuyến được biểu diễn bằng phương pháp hạt nhân và phương pháp nhận dạng khuôn mặt 3D trên thông tin 3D. 2) Phân tích sâu và nghiên cứu các yếu tố ảnh hưởng đến nhận dạng khuôn mặt, bao gồm nhận dạng khuôn mặt bất biến ánh sáng, đặt ra nhận dạng khuôn mặt bất biến và nhận dạng khuôn mặt bất biến biểu hiện. 3) Các biểu diễn tính năng mới được sử dụng, bao gồm các bộ mô tả cục bộ (mặt Gabor, mặt LBP, v.v.) và các phương pháp học sâu. 4) Sử dụng các nguồn dữ liệu mới, chẳng hạn như nhận dạng khuôn mặt dựa trên video và nhận dạng khuôn mặt dựa trên hình ảnh phác thảo và hồng ngoại gần. Kể từ năm 2007, cơ sở dữ liệu LFW đã trở thành tiêu chuẩn thử nghiệm cho nhận dạng khuôn mặt trong điều kiện thực tế. Bộ dữ liệu LFW bao gồm 13233 hình ảnh khuôn mặt của 5749 người từ Internet, trong đó 1680 người có hai hình ảnh trở lên. Giao thức kiểm tra tiêu chuẩn của LFW bao gồm nhiệm vụ xác nhận mười lần của 6000 cặp khuôn mặt. Mỗi phần bao gồm 300 cặp ví dụ tích cực và 300 cặp ví dụ tiêu cực. Độ chính xác trung bình mười lần được sử dụng làm chỉ số đánh giá hiệu suất. Kể từ khi phát hành LFW, hiệu suất đã liên tục được làm mới. Trước năm 2013, lộ trình kỹ thuật chính là học tập đo lường bộ mô tả cục bộ nhân tạo hoặc học tập. Sau năm 2014, tuyến kỹ thuật chính là học chuyên sâu. Kể từ năm 2014, dữ liệu lớn học sâu (dữ liệu khuôn mặt được gắn nhãn lớn) đã trở thành lộ trình kỹ thuật chủ đạo trong lĩnh vực nhận dạng khuôn mặt. Hai xu hướng quan trọng là: 1) mạng trở nên lớn hơn và sâu hơn (lớp vggface16, lớp facenet22). 2) Với lượng dữ liệu ngày càng tăng (deepface 4 triệu, facenet 200 triệu), dữ liệu lớn đã trở thành chìa khóa để cải thiện hiệu suất của nhận dạng khuôn mặt. Trong kỷ nguyên trước DL, lấy SDK thế hệ thứ ba và một nửa của phòng thí nghiệm vipl làm ví dụ, các điểm kỹ thuật chính bao gồm 1) hợp nhất tính năng mặt khối: tính năng Gabor tính năng LPQ. 2) Học không gian con để giảm tính năng (PCA LDA). 3) Sự kết hợp của mẫu chuẩn hóa khuôn mặt đa tỷ lệ. Các công nghệ liên quan của sdk3.5 đã đạt được tỷ lệ xác nhận 96% trong điều kiện tỷ lệ chấp nhận lỗi 0,1% trong Thử nghiệm FRGC 4, đây vẫn là kết quả tốt nhất trong tập dữ liệu FRGC. Cần lưu ý rằng mặc dù học sâu nhấn mạnh việc học tính năng, nhưng tính năng học tập không phải là bằng sáng chế của DL. Trong kỷ nguyên trước DL, công việc học trực tiếp biểu diễn từ hình ảnh bằng cách sử dụng các mô hình nông và học biểu diễn ngữ nghĩa dựa trên các bộ mô tả nhân tạo (chẳng hạn như thuộc tính và bộ phân loại mô phỏng để học biểu diễn thuộc tính cấp trung bình và Tom vs Pete để học biểu diễn ngữ nghĩa cấp cao ) được thấy trong các tài liệu có liên quan. Năm 2014, Facebook đã xuất bản công việc của mình trên cvpr14. Deepface đã kết hợp dữ liệu lớn (4 triệu dữ liệu khuôn mặt) với mạng tích chập sâu, đạt độ chính xác nhận dạng con người trên tập dữ liệu LFW. Deepface cũng giới thiệu một cấu trúc tích chập kết nối cục bộ để tìm hiểu một nhân tích chập riêng biệt tại mỗi vị trí không gian. Điểm bất lợi là nó sẽ dẫn đến việc mở rộng tham số. Cấu trúc này không trở nên phổ biến sau đó. Deepid family có thể được coi là một nhóm công việc tiêu biểu trong lĩnh vực nhận dạng khuôn mặt trong kỷ nguyên DL. Mạng deepid sớm nhất bao gồm bốn lớp tích chập và sử dụng chức năng suy hao softmax. Deepid2 xem xét cả mất danh tính và mất xác minh trên cơ sở mạng deepid2. Hai sự mất mát này có thể được thực hiện bằng cách sử dụng lớp softmaxwithlos và lớp mất độ tương phản tương ứng trong khung học sâu Caffe. Mạng Deepid2 bổ sung chức năng suy hao phụ trợ của mỗi lớp trên cơ sở deepid2 (tương tự như mạng được giám sát sâu). Google đã xuất bản công việc của mình trong cvpr2015. Facenet sử dụng 22 lớp mạng chập sâu và dữ liệu khuôn mặt khổng lồ (200 triệu hình ảnh của 8 triệu người) Và chức năng mất ba lần thường được sử dụng trong các tác vụ truy xuất hình ảnh. Điều đáng nói là, vì số lượng danh mục khuôn mặt đạt 8 triệu, nếu sử dụng softmax mất mát, số lượng nút lớp đầu ra sẽ đạt 8 triệu và yêu cầu bộ nhớ video ít nhất 32GB (giả sử rằng nút lớp ẩn cuối cùng có 1024, sử dụng số dấu phẩy động chính xác duy nhất) Tuy nhiên, mất bộ ba không cần chiếm thêm bộ nhớ video. Độ chính xác trung bình của Facenet về chiết khấu 10% trên tập dữ liệu LFW đạt 99,63%, đây cũng là kết quả tốt nhất trong các bài báo được công bố chính thức cho đến nay, gần như thông báo kết thúc cuộc thi hiệu suất tám năm trên LFW từ 2008 đến 2015.

Phát triển công nghệ nhận dạng khuôn mặt_ Taigewang 1

Liên lạc với chúng tôi
Bài viết được đề xuất
Trường hợp
Sự ra đời của các giải pháp đỗ xe lpr Chúng ta sẽ phải xem xét một số vấn đề rất phức tạp khi chúng ta viết nhiều điều mà mọi người cần hiểu
Sự ra đời của các giải pháp đỗ xe lpr Hệ thống đỗ xe Lpr hiện đã được lắp đặt trên tất cả các loại ô tô con và xe tải nhẹ. Chúng đã được lắp đặt trong nhiều ngành công nghiệp khác nhau
Giới thiệu các giải pháp đỗ xe lpr Một đoạn cho blog có tiêu đề 'Giới thiệu các giải pháp đỗ xe lpr' trong đó phần này tập trung vào 'Giới thiệu
Các yếu tố quan trọng cần xem xét trước khi mua giải pháp đỗ xe lpr là gì? Tôi đã mua thiết bị đỗ xe cho văn phòng của mình được một thời gian. Các chỉ
Giới thiệu về các giải pháp đỗ xe lpr Hầu hết khi ai đó cần sử dụng nhiều hơn một nút trên một thiết bị, họ sẽ chọn cách sử dụng phổ biến nhất
Các giải pháp đỗ xe lpr là gì? Hầu hết mọi người không biết họ đang tìm kiếm những gì trong một hệ thống đỗ xe. Rất nhiều lần họ chỉ đậu cùng một chỗ và h
Sự ra đời của các giải pháp đỗ xe lpr Máy đánh lô và máy đánh lô là phương tiện duy nhất để loại bỏ bụi bẩn và lá cây trên xe. Bằng cách cài đặt bollard hoặc thông minh
Sự ra đời của các giải pháp đỗ xe lpr Phát minh của thế giới hiện đại đã rất lâu đời. Lịch sử của công nghệ và tiến bộ đã lâu đời và đa dạng. Nó đã nhìn thấy adva
Sự ra đời của các giải pháp đỗ xe Lpr Hệ thống đỗ xe Lpr được thiết kế để nâng cao chất lượng cuộc sống cho những người sử dụng phương tiện giao thông công cộng. Các chỉ vấn đề
Giới thiệu về giải pháp đỗ xe lpr Đây là một phương pháp nổi tiếng để thu được kết quả chất lượng cao trong nhiều lĩnh vực. Nó còn được gọi là phương pháp dự đoán makin
không có dữ liệu
Thâm Quyến Tiger Wong Technology Co., Ltd là nhà cung cấp giải pháp kiểm soát truy cập hàng đầu cho hệ thống đỗ xe thông minh, hệ thống nhận dạng biển số xe, cửa quay kiểm soát truy cập dành cho người đi bộ, thiết bị đầu cuối nhận dạng khuôn mặt và LPR bãi đậu xe giải pháp .
không có dữ liệu
CONTACT US

Thâm quyến TigerWong Công Nghệ Co., LTD

Tel:86 13717037584

E-mail: info@sztigerwong.com

Địa chỉ: Tầng 1, Tòa nhà A2, Khu công nghiệp kỹ thuật số Silicon Valley Power, số 1. 22 Đường Dafu, Phố Guanlan, Quận Long Hoa,

Thâm Quyến, tỉnh Quảng Đông, Trung Quốc  

                    

Bản quyền©2021 thâm quyến TigerWong Công Nghệ Co., LTD  | Sơ đồ trang web
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
hủy bỏ
Customer service
detect