loading

การวิเคราะห์กรณีศึกษาเทคโนโลยีการเรียนรู้เชิงลึกบนพื้นฐานของ Spark และ bigdl

บทความนี้ส่วนใหญ่แบ่งปันประสบการณ์การปฏิบัติของ Intel และ JD ในการสร้างกรอบการสกัดคุณลักษณะภาพขนาดใหญ่โดยใช้เทคโนโลยีการเรียนรู้แบบ Spark และ bigdl Deep การสกัดคุณลักษณะ backgroundimage ใช้กันอย่างแพร่หลายในการดึงภาพที่คล้ายกันการทำสำเนาและอื่นๆ ก่อนที่จะใช้ bigdl Framework (ซึ่งจะมีการกล่าวถึงในภายหลัง) เราได้พยายามพัฒนาและปรับใช้แอพพลิเคชันการสกัดคุณลักษณะบน Multi Machine, multi GPU Card และ GPU Cluster ตามลำดับ อย่างไรก็ตามกรอบข้างต้นมีข้อเสียที่เห็นได้ชัด:

การวิเคราะห์กรณีศึกษาเทคโนโลยีการเรียนรู้เชิงลึกบนพื้นฐานของ Spark และ bigdl 1

ในกลุ่ม GPU กลยุทธ์การจัดสรรทรัพยากรตามการ์ด GPU มีความซับซ้อนมากและการจัดสรรทรัพยากรมีแนวโน้มที่จะมีปัญหาเช่นหน่วยความจำวิดีโอที่เหลืออยู่ไม่เพียงพอส่งผลให้ OOM และความผิดพลาดของแอปพลิเคชันในกรณีที่เครื่องเดียวเมื่อเทียบกับโหมดคลัสเตอร์นักพัฒนาซอฟต์แวร์จำเป็นต้องทำการกระจายข้อมูลด้วยตนเอง, โหลดและความคลาดเคลื่อนของความผิดพลาดการประยุกต์ใช้โหมด GPU, การ caffe เป็นตัวอย่าง, มีหลาย dependencies, รวมทั้ง CUDA, ซึ่งเพิ่มความยากลำบากในการใช้งานและการบำรุงรักษา. ตัวอย่างเช่นเมื่อมีปัญหากับเวอร์ชันระบบปฏิบัติการและเวอร์ชัน GCC ที่แตกต่างกันจะต้องมีการเรียบเรียงและบรรจุใหม่

ปัญหาข้างต้นทำให้โปรแกรมไปข้างหน้าขึ้นอยู่กับ GPU เผชิญกับความท้าทายด้านเทคนิคมากมายในด้านสถาปัตยกรรม

ลองดูที่ฉากตัวเอง เนื่องจากพื้นหลังของภาพจำนวนมากมีความซับซ้อนและสัดส่วนของวัตถุวัตถุมักจะมีขนาดเล็กเพื่อลดการแทรกแซงของพื้นหลังเกี่ยวกับความถูกต้องของการสกัดคุณลักษณะ, เรื่องต้องแยกออกจากภาพ ธรรมชาติกรอบของการสกัดคุณลักษณะภาพแบ่งออกเป็นสองขั้นตอน ประการแรกเป้าหมายจะถูกตรวจพบโดยอัลกอริทึมการตรวจจับเป้าหมายและคุณลักษณะเป้าหมายจะถูกสกัดโดยอัลกอริทึมการสกัดคุณลักษณะ ที่นี่เราใช้ SSD [1] (Single shot multibox Detector) สำหรับการตรวจจับเป้าหมายและเครือข่าย deepbit [2] สำหรับการสกัดคุณลักษณะ

Jingdong มีภาพผลิตภัณฑ์จำนวนมาก (มากกว่าหลายร้อยล้านภาพ) ในฐานข้อมูลโอเพนซอร์สแบบกระจายหลัก ดังนั้นวิธีการดึงข้อมูลและประมวลผลข้อมูลในสภาพแวดล้อมที่มีการกระจายขนาดใหญ่ได้อย่างมีประสิทธิภาพเป็นปัญหาสำคัญของท่อการสกัดคุณลักษณะภาพ โซลูชันที่ใช้ GPU ที่มีอยู่ต้องเผชิญกับความท้าทายอื่นๆในการแก้ปัญหาความต้องการของสถานการณ์ข้างต้น: การดาวน์โหลดข้อมูลใช้เวลานานและโครงการที่อิงกับ GPU ไม่สามารถเพิ่มประสิทธิภาพได้เป็นอย่างดีสำหรับข้อมูลภาพในฐานข้อมูลโอเพนซอร์สแบบกระจายกระบวนการประมวลผลข้อมูลในช่วงต้นของโครงการ GPU มีความซับซ้อนมาก, และไม่มีกรอบซอฟต์แวร์สำหรับการจัดการทรัพยากรการประมวลผลข้อมูลแบบกระจายและการจัดการความคลาดเคลื่อน

การวิเคราะห์กรณีศึกษาเทคโนโลยีการเรียนรู้เชิงลึกบนพื้นฐานของ Spark และ bigdl 2

เนื่องจากข้อจำกัดของซอฟต์แวร์ GPU และกรอบฮาร์ดแวร์จึงเป็นสิ่งที่ท้าทายมากในการขยายโครงการ GPU เพื่อจัดการกับภาพขนาดใหญ่ bigdl บูรณาการ schemein สภาพแวดล้อมการผลิตโดยใช้ซอฟต์แวร์ที่มีอยู่และสิ่งอำนวยความสะดวกฮาร์ดแวร์จะช่วยปรับปรุงประสิทธิภาพการผลิต (เช่นลด R & D เวลาของผลิตภัณฑ์ใหม่) และลดค่าใช้จ่าย ในกรณีนี้ข้อมูลจะถูกเก็บไว้ในฐานข้อมูลโอเพนซอร์สแบบกระจายหลักในกลุ่มข้อมูลขนาดใหญ่ หากโปรแกรมการเรียนรู้ลึกสามารถใช้กลุ่มข้อมูลขนาดใหญ่ที่มีอยู่ (เช่น Hadoop หรือ Spark Cluster) สำหรับการคำนวณก็สามารถแก้ปัญหาความท้าทายข้างต้นได้อย่างง่ายดาย

โครงการ open source bigdl ของ Intel [3] เป็นกรอบการเรียนรู้แบบกระจายลึกบน Spark ซึ่งให้การสนับสนุนอัลกอริทึมการเรียนรู้ลึกที่ครอบคลุม Bigdl สามารถขยายได้อย่างง่ายดายไปยังหลายร้อยหรือหลายพันโหนดที่มีความยืดหยุ่นกระจายของแพลตฟอร์ม Spark. ในเวลาเดียวกัน bigdl ใช้ไลบรารีการคำนวณทางคณิตศาสตร์ของ Intel mkl และเทคโนโลยีการประมวลผลแบบขนานเพื่อให้ได้ประสิทธิภาพสูงบนเซิร์ฟเวอร์ Intel Xeon (พลังงานในการประมวลผลสามารถเทียบได้กับประสิทธิภาพของ GPU หลัก) ในสถานการณ์สมมติของเรา bigdl ได้รับการปรับแต่งเพื่อสนับสนุนรูปแบบต่างๆ (การตรวจจับและการจำแนก); แบบจำลองนี้ได้รับการปลูกถ่ายจากสภาพแวดล้อมเฉพาะกับ bigdl big data Environment ซึ่งสนับสนุนรูปแบบทั่วไป (Cafe, Torch, TensorFlow); กระบวนการท่อทั้งหมดได้รับการเพิ่มประสิทธิภาพและเร่งท่อสำหรับการสกัดคุณลักษณะในสภาพแวดล้อม Spark ผ่าน bigdl แสดงในรูปที่1:

ใช้ Spark เพื่ออ่านภาพต้นฉบับนับร้อยล้านภาพจากฐานข้อมูลโอเพนซอร์สแบบกระจายและสร้าง rdduse Spark เพื่อประมวลผลภาพล่วงหน้ารวมถึงการปรับขนาดการลบค่าเฉลี่ยและการเขียนข้อมูลลงในแบตเตอรี่ bigdl เพื่อโหลดโมเดล SSD การตรวจจับเป้าหมายขนาดใหญ่และแบบกระจายจะดำเนินการในภาพผ่าน Spark และชุดพิกัดการตรวจจับและคะแนนที่สอดคล้องกันจะได้รับ

ผลการตรวจสอบที่มีคะแนนสูงสุดจะถูกเก็บไว้เป็นเป้าหมายของวัตถุและภาพเป้าหมายจะได้รับโดยการตัดภาพต้นฉบับตามผู้ประสานงานการตรวจจับกระบวนการ RDD ของเป้าหมายรูปภาพรวมถึงการปรับขนาดเพื่อสร้าง batchbigdl ใช้ในการโหลดแบบจำลอง deepbit และ Spark ใช้เพื่อดึงคุณสมบัติการกระจายของภาพเป้าหมายที่ตรวจพบเพื่อให้ได้ภาพที่สอดคล้องกันคุณสมบัติ

ผลการตรวจสอบ (ดึงคุณลักษณะเป้าหมาย RDD) จะถูกเก็บไว้ใน hdfsthe ท่อวิเคราะห์ข้อมูลทั้งหมดรวมทั้งการอ่านข้อมูลการแบ่งพาร์ติชันข้อมูลการประมวลผลล่วงหน้าการทำนายและการเก็บข้อมูลผล, สามารถใช้งานได้ง่ายใน Spark ผ่าน bigdl ในกลุ่มข้อมูลขนาดใหญ่ที่มีอยู่ (Hadoop/Spark) ผู้ใช้สามารถเรียกใช้แอปพลิเคชันการเรียนรู้ลึกโดยใช้ bigdl โดยไม่ต้องปรับเปลี่ยนการกำหนดค่าคลัสเตอร์ใดๆ นอกจากนี้ bigdl สามารถขยายไปยังโหนดและงานจำนวนมากได้โดยใช้ความสามารถในการปรับขนาดของแพลตฟอร์ม Spark สูงดังนั้นจึงช่วยเพิ่มความเร็วในกระบวนการวิเคราะห์ข้อมูลนอกเหนือจากการสนับสนุนการเรียนรู้แบบกระจายแล้ว bigdl ยังมีเครื่องมือที่ง่ายต่อการใช้งานเช่นไลบรารีเตรียมภาพเครื่องมือโหลดแบบจำลอง (รวมถึงรูปแบบการโหลดของกรอบการเรียนรู้ลึกของบุคคลที่สาม) ซึ่งสะดวกกว่าสำหรับผู้ใช้ในการสร้างท่อทั้ง

Image preprocessingbigdl มีไลบรารีประมวลผลภาพ [4] ขึ้นอยู่กับ OpenCV [5] ซึ่งสนับสนุนการแปลงภาพทั่วไปและฟังก์ชั่นการเพิ่มประสิทธิภาพภาพต่างๆ ผู้ใช้สามารถใช้ฟังก์ชันพื้นฐานเหล่านี้เพื่อสร้างท่อส่งภาพล่วงหน้าได้อย่างง่ายดาย นอกจากนี้ผู้ใช้ยังสามารถเรียกฟังก์ชัน OpenCV ที่ไลบรารีจัดเตรียมไว้เพื่อใช้การแปลงภาพที่กำหนดเองท่อประมวลผลล่วงหน้าของตัวอย่างนี้จะแปลง RDD ต้นฉบับเป็นชุด RDD ผ่านชุดของการแปลง ในหมู่พวกเขา bytetomat แปลงภาพไบต์เป็นรูปแบบการเก็บรักษาเสื่อของ OpenCV, ปรับขนาดปรับขนาดของภาพเพื่อ300x300, และ mattofloats ช่วยประหยัดพิกเซลในเสื่อลงในรูปแบบของอาร์เรย์ลอยและลบค่าเฉลี่ยของช่องที่สอดคล้องกัน ในที่สุด roiimagetobatch จะสร้างข้อมูลเป็นชุดซึ่งใช้เป็นข้อมูลอินพุตของแบบจำลองสำหรับการทำนายหรือการฝึกอบรม

โหลด modelusers สามารถใช้ bigdl เพื่อโหลดรุ่นที่ผ่านการฝึกอบรมก่อนและใช้โดยตรงในโปรแกรม Spark. ให้ไฟล์รุ่น bigdl คุณสามารถเรียกโมดูลได้โหลดเพื่อรับรุ่นนอกจากนี้ bigdl ยังสนับสนุนการนำเข้าแบบจำลองการเรียนรู้ลึกของบุคคลที่สามเช่น caffe, Torch และ TensorFlow

ผู้ใช้สามารถโหลดแบบจำลองที่ผ่านการฝึกอบรมสำหรับการทำนายข้อมูลการสกัดคุณลักษณะการปรับแต่งรูปแบบและอื่นๆ การใช้ caffe เป็นตัวอย่างโมเดลของ caffe ประกอบด้วยไฟล์สองไฟล์ไฟล์คำจำกัดความของโปรโตเท็กซ์และไฟล์พารามิเตอร์แบบจำลอง ดังที่แสดงไว้ด้านล่างผู้ใช้สามารถโหลดโมเดล caffe ที่ผ่านการฝึกอบรมมาแล้วล่วงหน้าลงในโปรแกรม Spark และ bigdl ได้อย่างง่ายดายประสิทธิภาพการทำงานของโซลูชัน GPU Cluster ขึ้นอยู่กับ caffe และโซลูชัน Xeon Cluster ตาม bigdl การทดสอบจะทำงานในสภาพแวดล้อมภายในคลัสเตอร์ของ JD

ทดสอบมาตรฐานเพื่อยุติการประมวลผลภาพและการวิเคราะห์ท่อรวมถึง: อ่านภาพจากฐานข้อมูลโอเพนซอร์สแบบกระจาย (ดาวน์โหลดภาพจากแหล่งภาพไปยังหน่วยความจำ)

ป้อนข้อมูลไปยังรูปแบบการตรวจจับเป้าหมายและรูปแบบการสกัดคุณลักษณะสำหรับการสกัดคุณลักษณะบันทึกผลลัพธ์ (เส้นทางภาพและคุณลักษณะ) ไปยังไฟล์ systemnote: ปัจจัยการดาวน์โหลดได้กลายเป็นปัจจัยสำคัญที่มีผลต่อการรับส่งข้อมูลแบบ end-to-end โดยรวม ในกรณีนี้ส่วนหนึ่งของเวลาในการประมวลผลนี้จะใช้เวลาประมาณครึ่งหนึ่งของเวลาในการประมวลผลทั้งหมด (คุณลักษณะการตรวจจับการดาวน์โหลด) เซิร์ฟเวอร์ GPU ไม่สามารถใช้ GPU เพื่อเร่งการประมวลผลการดาวน์โหลดได้

การทดสอบ environmentgpu: NVIDIA Tesla K40, 20การ์ดที่ดำเนินการพร้อมกัน CPU: Intel (R) Xeon (R) CPU e5-2650 V4 @ 2.20GHz, 1200แกนตรรกะทั้งหมดช่วยให้ Hyper Threading และมีการกำหนดค่าเป็น50แกนตรรกะของเส้นด้าย)

ผลการทดสอบรูปที่2แสดงให้เห็นว่า caffe's throughput ของ20 K40พร้อมกันการประมวลผลภาพประมาณ540ภาพ/วินาทีในขณะที่ bigdl ของ throughput บนเส้นด้าย (Xeon) คลัสเตอร์ที่มี1200แกนตรรกะประมาณ2070ภาพ/วินาที อัตราการรับส่งข้อมูลของ bigdl บน Xeon Cluster ประมาณ3.83เท่าของ GPU Cluster ซึ่งช่วยลดเวลาในการประมวลผลภาพขนาดใหญ่ลงอย่างมากผลการทดสอบแสดงให้เห็นว่า bigdl ให้การสนับสนุนที่ดีขึ้นในขนาดใหญ่ภาพคุณลักษณะการสกัดการใช้งาน ความสามารถในการปรับขนาดสูงของ bigdl ประสิทธิภาพสูงและความสะดวกในการใช้งานช่วยให้ JD สามารถรับมือกับการเติบโตของภาพขนาดใหญ่และระเบิดได้ง่ายขึ้น จากผลการทดสอบดังกล่าว JD กำลังอัปเกรดการดำเนินการสกัดคุณลักษณะ caffe image ตามคลัสเตอร์ GPU ไปยังโครงการ bigdl ตามกลุ่ม Xeon และปรับใช้เพื่อจุดประกายสภาพแวดล้อมการผลิตคลัสเตอร์

รูปที่2เปรียบเทียบปริมาณการผลิตของ K40และ Xeon ในฟีเจอร์ภาพที่มีคุณสมบัติการสกัดความสามารถในการปรับขนาดสูงของ pipelinebigdl ประสิทธิภาพสูงและความสะดวกในการใช้งานช่วยให้ JD สามารถใช้เทคโนโลยีการเรียนรู้ที่ลึกเพื่อประมวลผลภาพขนาดใหญ่ได้อย่างง่ายดาย JD จะยังคงใช้ bigdl กับแอพพลิเคชันการเรียนรู้ในเชิงลึกที่กว้างขึ้นเช่นการฝึกอบรมแบบกระจาย

[1]. Liu, Wei, et al. SSD: เครื่องตรวจจับ multibox แบบ single Shot. การประชุมยุโรปเกี่ยวกับวิสัยทัศน์คอมพิวเตอร์ สปริงเกอร์ Cham, 2016.[2] Lin, Kevin, et al. การเรียนรู้ descriptors ไบนารีขนาดกะทัดรัดที่มีเครือข่ายประสาทลึกที่ไม่ได้ดูแล การดำเนินการของการประชุม IEEE เกี่ยวกับวิสัยทัศน์ทางคอมพิวเตอร์และการรับรู้รูปแบบ2016 [3] การ https://github.com/intel-analyTIcs/BigDL

[4]. การ https://github.com/intel-analytics/analytics-zoo/tree/master/transform/vision[5].

ติดต่อกับพวกเรา
บทความที่แนะนำ
เคส
สิ่งที่ต้องมองหาในเครื่องจ่ายบัตรจอดรถ โดยส่วนใหญ่คุณจะพบว่าบัตรจอดรถมีหลายประเภท คุณจะเริ่มเหนื่อย
การแนะนำเครื่องจ่ายตั๋วที่จอดรถตู้ขายตั๋วที่จอดรถเป็นโทเค็นประเภททั่วไปที่ผู้คนใช้ในการซื้อสินค้าและบริการ เมื่อคุณ
วิธีการทำงานของเครื่องจ่ายบัตรจอดรถ คุณสามารถซื้อบัตรจอดรถออนไลน์โดยการซื้อบัตรจอดรถได้ง่าย ๆ แต่คุณยังสามารถชำระเงินด้วยบัตรเดบิต บัตรเครดิต เช็ค
การแนะนำเครื่องจ่ายตั๋วที่จอดรถเป็นวิธีการใหม่ในการขจัดความยุ่งยากในการชำระค่าตั๋วจอดรถ สำหรับคน W
วิธีการทำงานของเครื่องจ่ายบัตรจอดรถ เครื่องจ่ายบัตรจอดรถทำงาน noche esta edicin flickerrolls politika sin sadismo บุหรี่ shuhua nga qiaomiao miaoxian o harakk
การแนะนำเครื่องจ่ายบัตรจอดรถจำเป็นต้องมีประสบการณ์ที่ดีเมื่อใช้อินเทอร์เน็ต สำหรับผู้ที่ไม่แน่ใจว่าจะใช้อินเทอร์เน็ตอย่างไร i
วิธีการทำงานของเครื่องจ่ายบัตรจอดรถ ถ้าคุณไม่ชอบ ให้เดินจากไปและปล่อยมันไป นั่นเป็นวิธีที่คนที่ขับรถไปรอบๆ มักจะขับรถมาโดยตลอด เดอะ
การแนะนำเครื่องจ่ายตั๋วที่จอดรถ การประดิษฐ์เครื่องจ่ายตั๋วที่จอดรถเป็นการประดิษฐ์ที่เปลี่ยนวิธีที่ผู้คนจอดรถของพวกเขา Peop
ข้อมูลเบื้องต้นเกี่ยวกับเครื่องจ่ายบัตรที่จอดรถ มีหลายวิธีในการกำจัดบัตรจอดรถ สามารถจอดรถของคุณบนแท่นพิเศษ i
การแนะนำเครื่องจ่ายตั๋วโรงจอดรถเครื่องจ่ายตั๋วโรงจอดรถเป็นเครื่องมือที่ขาดไม่ได้สำหรับผู้ที่ไม่รู้ว่าจะใช้งานอย่างไร สำหรับผู้ที่
ไม่มีข้อมูล
เซินเจิ้น Tiger Wong Technology Co., Ltd เป็นผู้ให้บริการโซลูชันควบคุมการเข้าออกชั้นนำสำหรับระบบจอดรถอัจฉริยะของยานพาหนะ ระบบจดจำป้ายทะเบียน ประตูหมุนควบคุมการเข้าออกของคนเดินเท้า เทอร์มินัลการจดจำใบหน้า และ โซลูชั่นที่จอดรถ LPR .
ไม่มีข้อมูล
CONTACT US

เซินเจิ้น tigerwong เทคโนโลยีจำกัด

โทร:86 13717037584

อีเมล: ที่ info@sztigerwong.com

เพิ่ม: ชั้น 1 อาคาร A2 สวนอุตสาหกรรมดิจิทัลซิลิคอนวัลเลย์ พาวเวอร์ เลขที่ 22 ถนน Dafu ถนน Guanlan เขตหลงหัว

เซินเจิ้น มณฑลกวางตุ้ง ประเทศจีน  

                    

ลิขสิทธิ์แท้©2021เซินเจิ้น tigerwong เทคโนโลยีจำกัด  | แผนผังเว็บไซต์
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
ยกเลิก
Customer service
detect