Cách đây vài tuần, tôi đã xuất bản những gì tôi nghĩ vào thời điểm đó là một bài báo khá vô thưởng vô phạt: Cách tôi tái tạo một dự án trị giá 86 triệu đô la trong 57 dòng mã. Về cơ bản, tôi đang nói rằng Id đã sao chép cùng một công nghệ quét và xác nhận biển số xe mà cảnh sát ở Victoria, Úc vừa trả 86 triệu đô la.
Kể từ đó, các phản ứng xảy ra dồn dập. Bài viết của tôi đã nhận được hơn 100.000 lượt truy cập trong ngày đầu tiên, và cuối cùng thì nằm ở đâu đó khoảng 450.000. I đã được mời phát biểu trên các chương trình trò chuyện trên đài phát thanh địa phương và tại một hội nghị ở California.
Tôi nghĩ ai đó có thể đã hiểu nhầm Victoria, AU thành Victoria, BC. Mặc dù tôi đã lịch sự từ chối những lời đề nghị này, nhưng tôi đã gặp gỡ uống cà phê với nhiều nhà phát triển địa phương và các công ty tên tuổi lớn như nhau. Của nó đã được vô cùng thú vị.
Hầu hết độc giả đã xem nó vì cái gì: một bằng chứng về khái niệm để châm ngòi cho cuộc thảo luận về việc sử dụng công nghệ mã nguồn mở, chi tiêu của chính phủ và một người đàn ông mong muốn tạo ra những thứ hay ho từ chiếc ghế dài của mình. Pedants đã chỉ ra việc thiếu đào tạo, hỗ trợ và các phương pháp tăng chi phí CNTT thông thường cho doanh nghiệp, nhưng không đáng để bạn dành thời gian khám phá những điều này. Tôi muốn dành bài đăng này để xem xét kết quả của tôi và cách người khác có thể nâng cao độ chính xác của chính họ.
Trước khi chúng ta đi sâu vào kết quả, tôi muốn điểm qua một điều mà tôi cảm thấy bị mất trong bài viết gốc. Khái niệm cho dự án này bắt đầu hoàn toàn tách biệt với dự án BlueNet trị giá 86 triệu đô la. Nó hoàn toàn không phải là một nỗ lực để đánh bại nó.
Nó bắt đầu với suy nghĩ dai dẳng rằng vì OpenCV tồn tại và trang web VicRoads có kiểm tra biển số xe, nên phải có cách kết hợp cả hai hoặc sử dụng thứ gì đó tốt hơn. Chỉ khi bắt đầu viết bài, tôi mới tình cờ gặp BlueNet. Trong khi khám phá BlueNet và thẻ giá của nó đã cho tôi một góc biên tập tuyệt vời, với mã đã được viết sẵn.
Chắc chắn có một số mâu thuẫn giữa các dự án. Tôi cũng tin rằng một phần lý do khiến điều này xảy ra là do thời điểm thuận tiện của một báo cáo về chi tiêu lãng phí cho CNTT của chính phủ ở Úc. Hóa đơn CNTT của Chính phủ Liên bang đã tăng vọt từ $ 5.
9 tỷ đến 10 tỷ đô la, và nó mang lại giá trị đáng ngờ cho vụ nổ đó. Các nhà nghiên cứu truyền thông liên hệ với tôi đã nhanh chóng liên kết cả hai, nhưng đây không phải là điều tôi nhanh chóng khuyến khích.
Người chủ trước đây của tôi đã giao các dự án CNTT nhỏ hơn (dưới 1 triệu đô la) cho Cảnh sát Victoria và các cơ quan tiểu bang khác. Do đó, tôi đã trải qua các cuộc kiểm tra của cảnh sát và hoàn thành các mẫu đơn cần thiết để trở thành nhà thầu VicPol.
Cả hai đều đúng thời gian và ngân sách. Tôi đã ghi lại nhiều cảnh quay thử nghiệm khác nhau và đây là clip thành công nhất.
Tôi sẽ đi vào chi tiết về thiết lập máy ảnh lý tưởng, vùng phát hiện và hơn thế nữa sau video. Nó sẽ giúp bạn hiểu rõ hơn điều gì đã làm cho video tôi quay qua kính chắn gió này trở thành video hay hơn video Contour HD được đặt góc ngoài cửa sổ bên. Tình huống khó xử về đạo đức Nếu bạn nhìn thấy hình ảnh anh hùng của bài viết này hoặc xem video ở trên, bạn có thể nhận thấy một diễn biến rất thú vị: Tôi đã bắt được một ai đó.
Cụ thể, tôi bắt gặp một người điều khiển xe bị hủy đăng ký từ năm 2016. Điều này có thể xảy ra vì nhiều lý do, trong đó vô tội nhất là hoạt động bán lại gian lận. Đôi khi, việc mua bán xe tư nhân không được làm thủ tục ra sổ, người mua và người bán có thể không làm thủ tục chuyển nhượng chính chủ.
Điều này tiết kiệm cho người mua hàng trăm đô la, nhưng chiếc xe vẫn được đăng ký cho người bán. Việc người bán hủy đăng ký và nhận tiền hoàn lại bất thường cho những tháng còn lại, cũng trị giá hàng trăm đô la không phải là chưa từng có. Ngoài ra, người điều khiển phương tiện cũng có thể là tội phạm mà chúng tôi nghi ngờ là họ.
Vì vậy, mặc dù tôi đã đặt tên đùa là Project plate-snitch khi tôi thiết lập nó trên máy tính của mình, nhưng giờ đây tôi phải đối mặt với câu hỏi hóc búa là liệu có nên báo cáo những gì tôi đã thấy hay không. Nhưng lái xe trên một đăng ký năm 2016 (đã hủy bỏ, chưa hết hạn) là một động thái rất cân nhắc.
Hmm. Trở lại kết quả Trong số rất nhiều phản ứng đối với bài viết của tôi, một số lượng đáng kể là khá theo nghĩa đen và không rõ ràng. Vì tôi nói rằng tôi sao chép phần mềm, họ khẳng định rằng tôi phải có trung tâm hỗ trợ, bảo hành và hướng dẫn đào tạo.
Một người thậm chí còn cố gắng sao chép kết quả của tôi và gặp phải rào cản không thể tránh khỏi về chất lượng hình ảnh và tài liệu nguồn. Tôi chỉ có thể nói, Chà, duh.
Khi tôi xây dựng bằng chứng khái niệm ban đầu của mình (một lần nữa, tập trung vào việc xác thực một ý tưởng, không sao chép BlueNet), tôi đã sử dụng một tập mẫu nhỏ gồm ít hơn mười hình ảnh. Vì thiết lập máy ảnh là một trong những yếu tố quan trọng nhất, nếu không muốn nói là quan trọng nhất trong ALPR, nên tôi đã chọn chúng để có những đặc điểm lý tưởng giúp tăng cường khả năng nhận diện.
Sự đổi mới và thách thức thực sự đến từ việc đưa ra một bằng chứng về khái niệm và làm cho nó hoạt động. Trong suốt sự nghiệp chuyên nghiệp của tôi, nhiều nhà phát triển cấp cao đã nói với tôi rằng mọi thứ không thể được thực hiện hoặc ít nhất là không thể được thực hiện một cách kịp thời. Đôi khi họ là bên phải.
Thông thường, họ chỉ sợ rủi ro, không có gì là không thể cho đến khi nó được chứng minh là có.
Đối với tôi, nó tóm tắt gọn gàng một tư duy phát triển lành mạnh, trong đó các ý tưởng tăng đột biến và xác thực là điều gần như bắt buộc để hiểu chúng. Điều này chỉ có thể xảy ra với sự kết hợp của các giải pháp phần cứng, phần mềm và mạng.
Sau khi đăng bài viết gốc của tôi, những người bán máy ảnh ALPR đã nhanh chóng đưa ra lời khuyên. Mặc dù tôi khám phá các yếu tố quan trọng khác bên dưới, nhưng không có yếu tố nào dẫn đến sự gia tăng tuyệt đối về sự công nhận như thế này.
Nhìn chung, các giải pháp ALPR chuyên nghiệp được bù đắp theo một góc, được đào tạo về vị trí của biển số xe và phóng to vào khu vực đó để tối đa hóa độ rõ nét. của một thấu kính cố định.
Chúng bao gồm: Một camera hành động Contour HD. Chúng ra mắt vào năm 2009 và tôi sử dụng của mình để ghi lại lộ trình đi xe đạp của mình và để phát lại trải nghiệm suýt chết mỗi tuần. Fujifilm X100S (nổi tiếng là ống kính một tiêu cự cố định) iPhone 6 của tôi.
Phương pháp tái tạo zoom quang học duy nhất của tôi là sử dụng một ứng dụng để ghi lại ở 3K thay vì 1080p, sau đó thu phóng và cắt ảnh kỹ thuật số. Một lần nữa, nhiều pixel hơn để chơi cùng. & Định vị Góc nhìn 30 thường được coi là tiêu chuẩn để nhận dạng tấm lý tưởng.
Điều này cực kỳ quan trọng khi bạn biết rằng BlueNet sử dụng một loạt các camera. Nó cũng có ý nghĩa khi bạn xem xét những gì một camera phía trước nhìn chung sẽ không nhiều lắm.
Nó sẽ bao gồm một camera chính giữa nhọn như trên, hai camera lệch tâm ở mỗi bên 30 và một camera phía sau duy nhất. Giá trị của việc hầu hết các camera hướng về phía trước sẽ đến từ việc tăng thời gian phản ứng nếu xe đi ngược chiều. Điều này sẽ cho phép quét, xử lý và quay đầu nhanh hơn so với việc các camera phía sau bắt được một chiếc xe khả nghi đã cách xe cảnh sát mười mét.
A Gymbal Khi tổng hợp video, tôi đã nghĩ đến việc ổn định cảnh quay. Thay vào đó, tôi chọn thể hiện chuyến đi gập ghềnh cho đúng như thế nào. Những gì bạn thấy là tôi cầm điện thoại gần kính chắn gió trong khi vợ tôi lái xe.
Kiểm tra phương pháp khoa học nghiêm ngặt đó. Các yếu tố quan trọng khác Tỷ lệ khung hình Cả nỗ lực tái tạo dự án của tôi và các bản ghi âm của tôi kể từ đó đã khám phá ra cùng một quan niệm sai lầm rằng tốc độ khung hình lấy mẫu ALPR có thể liên quan đến thành công. Theo kinh nghiệm của tôi, điều này không làm gì khác ngoài việc lãng phí chu kỳ.
Thay vào đó, điều cực kỳ quan trọng là tốc độ cửa trập tạo ra những thước phim rõ ràng, sắc nét, kết hợp tốt với thuật toán. Nhưng tôi cũng đang thử nghiệm cảnh quay tốc độ khá thấp. Nhiều nhất, hai xe vượt nhau trong vùng 60km / h tạo ra chênh lệch 120km / h.
Mặt khác, BlueNet có thể hoạt động với vận tốc được cho là 200km / h. Để giải quyết vấn đề này, một đồng nghiệp đã đề xuất phát hiện đối tượng và xử lý ngoài băng tần. Xác định một chiếc xe và vẽ một hộp giới hạn.
Chờ nó đi vào góc nhận dạng lý tưởng và thu phóng. Sau đó, chụp một loạt ảnh để xử lý không đồng bộ. Tôi đã xem xét sử dụng OpenCV (node-opencv) để nhận dạng đối tượng, nhưng tôi thấy một thứ đơn giản hơn như nhận diện khuôn mặt, chụp ở bất kỳ đâu từ 600800ms.
Không chỉ ít hơn lý tưởng cho việc sử dụng của tôi, mà còn khá kém nói chung. Hype-train TensorFlow đến giải cứu. Có thể chạy trên thiết bị, có những ví dụ về các dự án xác định nhiều phương tiện trên mỗi khung hình ở mức 27 đáng kinh ngạc.
7fps. Phiên bản này thậm chí có thể hiển thị các ước tính tốc độ. Về mặt pháp lý là vô giá trị, nhưng có lẽ hữu ích trong việc lập chính sách hàng ngày (không có tiêu chuẩn fps trong readme).
Để giải thích rõ hơn cách nhận dạng xe hiệu suất cao có thể kết hợp với các kỹ thuật ALPR chậm hơn, tôi đã tạo một video khác trong After Effects. Tôi tưởng tượng rằng hai hoạt động cầm tay sẽ trông giống như thế này: Tốc độ khung hình và Tốc độ màn trập Một biểu hiện khác nhau của tốc độ khung hình bị ảnh hưởng phần lớn đến tốc độ cửa trập và cụ thể hơn, các vấn đề về cửa trập ảnh hưởng đến phim kỹ thuật số đầu hoặc thấp máy ghi âm. Sau đây là ảnh chụp nhanh từ một số cảnh phim Contour HD.
Bạn có thể thấy chỉ ở tốc độ 60km / h, vấn đề màn trập lăn khiến cảnh quay ít nhiều không sử dụng được theo quan điểm ALPR. Việc điều chỉnh tốc độ khung hình trên cả Contour HD và iPhone của tôi không dẫn đến biến dạng ít hơn đáng kể. Về lý thuyết, tốc độ màn trập cao hơn sẽ tạo ra hình ảnh rõ ràng và sắc nét hơn.
Chúng ngày càng trở nên quan trọng nếu bạn theo đuổi điểm chuẩn BlueNet 200km / h. Ít nhòe hơn và ít biến dạng cửa trập hơn lý tưởng sẽ dẫn đến việc đọc tốt hơn. Mở phiên bản ALPR Một trong những khám phá thú vị hơn là phiên bản node-openalpr mà tôi đang sử dụng đã lỗi thời và gần như không mạnh bằng giải pháp độc quyền của họ.
Mặc dù yêu cầu về nguồn mở chắc chắn là một yếu tố, nhưng thật đáng kinh ngạc khi phiên bản đám mây có thể đọc thành công các khung mà tôi thậm chí không thể xác định được một tấm trên đó một cách chính xác như thế nào. không có cách nào để ghi đè nó. Bạn phải kéo một người nào đó xuống elses fork, điều này cho phép bạn sau đó cung cấp thêm một tham số quốc gia.
Nhưng điều này doesnt luôn luôn giúp đỡ. Sử dụng thuật toán mặc định của Hoa Kỳ, tôi có thể tạo ra nhiều kết quả nhất. Việc chỉ định tập dữ liệu của Úc thực sự đã làm giảm một nửa số lần đọc đĩa thành công và nó chỉ tìm được một hoặc hai mà thuật toán của Hoa Kỳ không thể.
Việc cung cấp bộ đĩa rộng Úc riêng biệt một lần nữa đã giảm một nửa số lượng và giới thiệu một tấm phụ duy nhất. Victoria là một yếu tố góp phần.
Planar warp đề cập đến một phương pháp trong đó tọa độ được chuyển đến thư viện để xiên, dịch và xoay một hình ảnh cho đến khi nó gần giống với một tấm phẳng. tất cả các tốc độ. Khi bạn xem xét việc lăn cửa trập, có nghĩa là sự biến dạng tăng lên so với tốc độ của xe.
Tôi sẽ tưởng tượng việc cung cấp dữ liệu gia tốc kế hoặc tốc độ GPS như một hệ số có thể hoạt động. Hoặc, bạn biết đấy, hãy mua một chiếc máy ảnh hoàn toàn không phải là rác. Những người khác đang làm gì trong ngành Nhiều độc giả đã liên hệ sau bài đăng cuối cùng để chia sẻ kinh nghiệm và ý tưởng của riêng họ.
Có lẽ một trong những giải pháp thú vị hơn được chia sẻ với tôi là của Auror ở New Zealand. Họ sử dụng camera ALPR cố định trong các trạm xăng để báo cáo về những người ăn cắp xăng dầu. Điều này tự nó không phải là đặc biệt mới và mang tính cách mạng.
Nhưng khi kết hợp với mạng của họ, họ có thể tự động đưa ra cảnh báo khi những kẻ phạm tội được biết đã quay trở lại hoặc đang nhắm mục tiêu vào các trạm xăng trong khu vực. BlueNet. Một số có thể sẽ có giá tốt hơn những nơi khác, vì những nơi như Israel sử dụng biển số xe bảy chữ số không có ký tự trong bảng chữ cái.
Những bài học rút ra đơn giản là có quá nhiều thứ mà tôi đã học được trong vài tuần cuối cùng của việc nghiên cứu để đưa vào một bài đăng. Mặc dù có rất nhiều lời gièm pha nhưng tôi thực sự đánh giá cao sự hỗ trợ và kiến thức đã được gửi đến cho tôi. .
Để nhìn mọi thứ theo quan điểm, tôi là một nhà thiết kế và nhà phát triển giao diện người dùng. Ive đã dành khoảng mười giờ cho cảnh quay và mã, tám giờ khác để sản xuất video, và ít nhất mười giờ khác chỉ riêng cho viết-up. Ive đã đạt được những gì mình có bằng cách đứng trên vai những người khổng lồ.
Tôi đang cài đặt các thư viện do những người thông minh xây dựng và đã tận dụng lời khuyên từ những người bán những chiếc máy ảnh này để kiếm sống. Bạn nên đổ thêm nhiều tiền nữa để làm một công việc thực sự tốt? Giải pháp của tôi thậm chí không cùng hệ mặt trời với 99.
Máy quét chính xác 999% mà một số người bình luận trên internet dường như mong đợi. Nhưng một lần nữa, BlueNet chỉ phải đáp ứng mục tiêu chính xác 95%. Vì vậy, nếu 1 triệu đô la giúp bạn có độ chính xác 80% và có thể 10 triệu đô la giúp bạn chính xác đến 90% khi nào bạn ngừng chi tiêu?
Hơn nữa, xem xét rằng công nghệ đã được chứng minh ứng dụng thương mại ở Châu Đại Dương, thì người đóng thuế nên đổ thêm bao nhiêu tiền vào một giải pháp độc quyền, có nguồn gốc gần gũi khi các công ty khởi nghiệp địa phương có thể hưởng lợi? Úc được cho là một quốc gia đổi mới
Thâm quyến TigerWong Công Nghệ Co., LTD
Tel:86 13717037584
E-mail: info@sztigerwong.com
Địa chỉ: Tầng 1, Tòa nhà A2, Khu công nghiệp kỹ thuật số Silicon Valley Power, số 1. 22 Đường Dafu, Phố Guanlan, Quận Long Hoa,
Thâm Quyến, tỉnh Quảng Đông, Trung Quốc