loading

Spark болон Bigdl дээр суурилсан гүнзгий сургалтын технологийн кейсийн шинжилгээ

Энэхүү нийтлэлд голчлон Intel болон JD-ийн spark болон bigdl гүнзгий суралцах технологид суурилсан том хэмжээний зургийн онцлог задлах тогтолцоог бий болгох практик туршлагыг хуваалцсан болно. BackgroundЗургийн шинж чанарыг задлах нь ижил төстэй зураг хайх, хуулбарлах гэх мэт ажилд өргөн хэрэглэгддэг. Bigdl фреймворкийг ашиглахын өмнө (үүнийг дараа дурдах болно) бид олон машин, олон GPU карт болон GPU кластер дээр онцлог задлах програмуудыг боловсруулж, байрлуулахыг оролдсон. Гэсэн хэдий ч дээрх хүрээнүүд нь тодорхой сул талуудтай байдаг:

Spark болон Bigdl дээр суурилсан гүнзгий сургалтын технологийн кейсийн шинжилгээ 1

GPU кластерт GPU карт дээр суурилсан нөөцийн хуваарилалтын стратеги нь маш нарийн төвөгтэй бөгөөд нөөцийн хуваарилалт нь видео санах ой хангалтгүй үлдэх зэрэг асуудалд өртөмтгий байдаг бөгөөд үүний үр дүнд гацах, програм гацах зэрэг асуудал гардаг. Нэг машинтай харьцуулахад Кластер горимын хувьд хөгжүүлэгчид өгөгдлийн хуваагдал, ачаалал болон алдааг тэсвэрлэх чадварыг гараар хийх шаардлагатай байдаг. Caffe-г жишээ болгон авч үзвэл GPU горимын хэрэглээ нь CUDA зэрэг олон хамааралтай байдаг нь байршуулалт, засвар үйлчилгээний хүндрэлийг нэмэгдүүлдэг. Жишээлбэл, үйлдлийн системийн өөр хувилбарууд болон GCC хувилбаруудад асуудал гарсан тохиолдолд тэдгээрийг дахин эмхэтгэж, багцлах хэрэгтэй.

Дээрх асуудлууд нь GPU дээр суурилсан урагшлах програмыг архитектурт техникийн хэрэглээний олон сорилттой тулгардаг.

Энэ дүр зургийг өөрөө харцгаая. Олон зургийн арын дэвсгэр нь нарийн төвөгтэй бөгөөд субьектийн объектын эзлэх хувь ихэвчлэн бага байдаг тул онцлогийг гаргаж авах нарийвчлалд арын дэвсгэрийн хөндлөнгийн оролцоог багасгахын тулд субьектийг зургаас тусгаарлах шаардлагатай. Мэдээжийн хэрэг, зургийн онцлогийг задлах хүрээ нь хоёр үе шатанд хуваагддаг. Эхлээд зорилтот шинж чанарыг илрүүлэх алгоритмаар илрүүлж, дараа нь зорилтот шинж чанарыг задлах алгоритмаар гаргаж авдаг. Энд бид зорилтот илрүүлэхийн тулд SSD [1] (нэг удаагийн олон хайрцаг илрүүлэгч), функцийг задлахад гүн бит [2] сүлжээг ашигладаг.

Jingdong нь өргөн тархсан нээлттэй эхийн мэдээллийн санд олон тооны (зуу зуун сая гаруй) бүтээгдэхүүний зурагтай. Тиймээс том хэмжээний тархсан орчинд өгөгдлийг хэрхэн үр ашигтайгаар олж авах, боловсруулах нь зургийн онцлогийг задлах дамжуулах хоолойн гол асуудал юм. Одоо байгаа GPU-д суурилсан шийдлүүд дээр дурдсан хувилбаруудын шаардлагыг шийдвэрлэхэд бусад сорилтуудтай тулгардаг: Өгөгдөл татаж авахад удаан хугацаа шаардагддаг бөгөөд GPU дээр суурилсан схем нь үүнийг сайн оновчтой болгож чадахгүй. Түгээмэл нээлттэй эхийн мэдээллийн сан дахь зургийн мэдээллийн хувьд эхний өгөгдөл GPU схемийг боловсруулах үйл явц нь маш нарийн төвөгтэй бөгөөд нөөцийн менежмент, тархсан өгөгдөл боловсруулах, алдааны хүлцлийн менежментийн төлөвшсөн програм хангамжийн тогтолцоо байдаггүй.

Spark болон Bigdl дээр суурилсан гүнзгий сургалтын технологийн кейсийн шинжилгээ 2

GPU программ хангамж, техник хангамжийн хүрээ хязгаарлагдмал тул том хэмжээний зурагтай ажиллахын тулд GPU схемийг өргөжүүлэх нь маш хэцүү байдаг.Bigdl интеграцийн схем Үйлдвэрлэлийн орчинд одоо байгаа программ хангамж, техник хангамжийн хэрэгслийг ашиглах нь үйлдвэрлэлийн үр ашгийг (жишээ нь) ихээхэн сайжруулах болно. R-ийг багасгах & D шинэ бүтээгдэхүүний цаг) болон зардлыг бууруулах. Энэ тохиолдолд өгөгдөл нь том мэдээллийн кластер дахь нийтлэг тархсан нээлттэй эхийн мэдээллийн санд хадгалагдана. Хэрэв гүнзгий суралцах програм нь одоо байгаа том өгөгдлийн кластерийг (Hadoop эсвэл spark кластер гэх мэт) тооцоолоход ашиглаж чадвал дээрх бэрхшээлийг амархан шийдэж чадна.

Intel-ийн нээлттэй эхийн bigdl төсөл [3] нь гүнзгий суралцах алгоритмын иж бүрэн дэмжлэг үзүүлдэг spark дээр тархсан гүнзгий сургалтын тогтолцоо юм. Bigdl-ийг spark платформын тархсан өргөтгөлийн тусламжтайгаар хэдэн зуу эсвэл мянга мянган зангилаа хүртэл хялбархан сунгаж болно. Үүний зэрэгцээ, bigdl нь Intel Xeon сервер дээр өндөр гүйцэтгэлд хүрэхийн тулд Intel MKL математикийн тооцоолох номын сан болон зэрэгцээ тооцоолох технологийг ашигладаг (тооцоолох чадвар нь үндсэн GPU-ийн гүйцэтгэлтэй харьцуулж болно). Манай хувилбарт bigdl нь янз бүрийн загваруудыг дэмжихээр тохируулагдсан байдаг. (илрүүлэх, ангилах); Загвар нь зөвхөн тодорхой орчинд хэрэглэгдэхээс ерөнхий загварыг (кафе, бамбар, тензорфлектор) дэмждэг bigdl том мэдээллийн орчинд шилжүүлсэн; Дамжуулах хоолойн үйл явцыг бүхэлд нь оновчтой болгож, хурдасгасан. Bigdl-ээр дамжуулан очийн орчинд шинж чанарыг задлах дамжуулах хоолойг Зураг дээр үзүүлэв. 1:

Түгээмэл нээлттэй эхийн мэдээллийн сангаас хэдэн зуун сая эх зургийг уншихын тулд spark-ийг ашигла, хэмжээг өөрчлөх, дундаж утгыг хасах, өгөгдлийг багц болгон бүрдүүлэх зэрэг зургийг урьдчилан боловсруулахын тулд RDDUse очыг бүтээгээрэй. Зорилтот илрүүлэлтийг зураг дээр оч ашиглан хийж, хэд хэдэн илрүүлэх координат болон холбогдох оноог авдаг.

Хамгийн өндөр оноо авсан илрүүлэлтийн үр дүнг объектын зорилт болгон хадгалах ба зорилтот дүрсийг илрүүлэх координатын дагуу эх зургийг таслах замаар олж авах бөгөөд багц үүсгэхийн тулд зорилтот зургийн RDD-г урьдчилан боловсруулах, түүний дотор хэмжээг өөрчлөх.Bigdl нь гүн битийг ачаалахад ашиглагддаг. загвар, мөн оч нь харгалзах шинж чанарыг олж авахын тулд илрүүлсэн зорилтот зургийн тархсан шинж чанарыг задлахад ашигладаг

Илрүүлсэн үр дүнгүүд (олж авсан зорилтот онцлог RDD) нь HDFS-д хадгалагддаг. Өгөгдөл унших, хуваах, урьдчилан боловсруулах, таамаглах, үр дүнг хадгалах гэх мэт бүх өгөгдлийн шинжилгээний шугамыг bigdl-ээр дамжуулан хялбархан хэрэгжүүлэх боломжтой. Одоо байгаа том өгөгдлийн кластер (Hadoop / spark) дээр хэрэглэгчид кластерийн тохиргоог өөрчлөхгүйгээр bigdl ашиглан гүнзгий суралцах програмуудыг ажиллуулж болно. Түүнчлэн, bigdl-ийг spark платформын өндөр өргөтгөх чадварыг ашиглан олон тооны зангилаа, даалгаварт хялбархан өргөтгөх боломжтой тул өгөгдөлд дүн шинжилгээ хийх процессыг ихээхэн хурдасгадаг. Тархсан гүнзгий суралцах дэмжлэгээс гадна bigdl нь олон тооны хялбар зураг урьдчилан боловсруулах номын сан, загвар ачаалах хэрэгсэл (гуравдагч талын гүнзгий сургалтын тогтолцооны ачаалах загваруудыг оруулаад) гэх мэт хэрэгслүүдийг ашиглах нь хэрэглэгчдэд дамжуулах хоолойг бүхэлд нь барихад илүү тохиромжтой.

Image preprocessingBigdl нь янз бүрийн нийтлэг дүрс хувиргах болон дүрсийг сайжруулах функцуудыг дэмждэг OpenCV [5] дээр суурилсан дүрсийг урьдчилан боловсруулах номын сангаар хангадаг [4]. Хэрэглэгчид эдгээр үндсэн функцуудыг ашиглан зурагны урьдчилсан боловсруулалтын шугамыг бий болгоход хялбар байдаг. Нэмж дурдахад хэрэглэгчид номын сангаас өгсөн opencv функцийг дуудаж, зураг хөрвүүлэх ажлыг гүйцэтгэх боломжтой. Энэхүү дээжийн урьдчилсан боловсруулалт нь хэд хэдэн хувиргалтаар анхны RDD-г багц RDD болгон хувиргадаг. Тэдгээрийн дотроос bytetomat нь байт зургийг OpenCV-ийн mat хадгалах формат руу хөрвүүлж, зургийн хэмжээг 300x300 болгон өөрчилж, mattofloats нь дэвсгэр дэх пикселүүдийг float массивын формат руу хадгалж, харгалзах сувгийн дундаж утгыг хасдаг. Эцэст нь, roiimagetobatch нь өгөгдлийг багц болгон бүрдүүлдэг бөгөөд энэ нь таамаглал эсвэл сургалтанд зориулж загварын оролт болгон ашигладаг.

Загварыг ачаалж байна Хэрэглэгчид bigdl ашиглан урьдчилан бэлтгэсэн загвараа ачаалж, Spark программ дээр шууд ашиглах боломжтой. Bigdl загварын файлыг авч үзвэл та module.load руу залгаж загвараа авах боломжтой. Үүнээс гадна bigdl нь Caffe, torch, tensorflow зэрэг гуравдагч талын гүнзгий сургалтын тогтолцооны загваруудыг импортлохыг дэмждэг.

Хэрэглэгчид дата таамаглах, онцлог задлах, загварыг нарийн тааруулах гэх мэтээр бэлтгэгдсэн загварыг хялбархан ачаалж болно. Caffe-г жишээ болгон авч үзвэл Caffe-ийн загвар нь загварын прототекст тодорхойлолтын файл болон загварын параметрийн файл гэсэн хоёр файлаас бүрдэнэ. Доор үзүүлсэн шиг хэрэглэгчид урьдчилан бэлтгэгдсэн Caffe загварыг spark болон bigdl программд хялбархан ачаалж болно.performanceБид Caffe дээр суурилсан GPU кластер шийдэл болон bigdl дээр суурилсан Xeon кластерийн шийдлийн гүйцэтгэлийг харьцуулж үздэг. Туршилтууд нь JD-ийн дотоод кластер орчинд явагдаж байна.

Зургийн боловсруулалт, дүн шинжилгээ хийх стандартыг турших, үүнд: Түгээмэл нээлттэй эхийн мэдээллийн сангаас зургуудыг унших (зургийн эх сурвалжаас санах ой руу зураг татах)

Зорилтот илрүүлэлтийн загвар болон онцлог задлахад зориулсан онцлог задлах загварт оруулах Үр дүнг (зургийн зам, онцлог) файлын системд хадгалах Тайлбар: татаж авах хүчин зүйл нь эцсийн дамжуулалтад нөлөөлөх чухал хүчин зүйл болсон. Энэ тохиолдолд боловсруулах хугацааны энэ хэсэг нь нийт боловсруулах хугацааны тал орчим хувийг эзэлдэг (татаж авах илрүүлэх онцлог). GPU сервер нь татаж авах процессыг хурдасгахын тулд GPU-г ашиглах боломжгүй.

туршилтын орчинGPU: NVIDIA Tesla K40, нэгэн зэрэг ажилладаг 20 картCPU: Intel (R) Xeon (R) CPU e5-2650 V4 @ 2.20GHz, нийт 1200 логик цөм (сервер бүр 24 физик цөмтэй, гипер урсгалыг идэвхжүүлдэг бөгөөд тохируулагдсан байдаг. 50 логик утас утас)

Туршилтын үр дүн Зураг 2-оос харахад Caffe-ийн 20 K40 зургийг зэрэгцүүлэн боловсруулах чадвар нь ойролцоогоор 540 зураг/с, харин bigdl-ийн 1200 логик цөмтэй утас (Xeon) кластер дээрх дамжуулах чадвар нь 2070 зураг/сек орчим байна. Xeon кластер дээрх bigdl-ийн нэвтрүүлэх чадвар нь GPU кластераас 3.83 дахин их бөгөөд энэ нь том хэмжээний зураг боловсруулах хугацааг ихээхэн богиносгодог. Туршилтын үр дүнд bigdl нь том хэмжээний зургийн онцлог задлах програмуудад илүү сайн дэмжлэг үзүүлдэг болохыг харуулж байна. Bigdl-ийн өндөр цар хүрээтэй, өндөр гүйцэтгэлтэй, ашиглахад хялбар байдал нь JD-д зургийн масштабын асар их, тэсрэлттэй өсөлтийг хялбархан даван туулахад тусалдаг. Ийм туршилтын үр дүнд үндэслэн JD нь GPU кластер дээр суурилсан Caffe дүрсний онцлог хандалтыг Xeon кластерт суурилсан bigdl схем болгон сайжруулж, кластерийн үйлдвэрлэлийн орчинг идэвхжүүлэх зорилгоор байрлуулж байна.

Зураг 2-т K40 болон Xeon-ийн дамжуулах чадварыг зургийн онцлогийг задлах хоолойд харьцуулна уу.Bigdl-ийн өндөр өргөтгөх чадвар, өндөр гүйцэтгэл, ашиглахад хялбар байдал нь JD-д их хэмжээний зургийг боловсруулахад гүнзгий суралцах технологийг илүү хялбар ашиглахад тусалдаг. JD нь тархсан загварын сургалт гэх мэт илүү өргөн хүрээний гүнзгийрүүлсэн сургалтын програмуудад bigdl-ийг үргэлжлүүлэн ашиглах болно.quote

[1]. Liu, Wei, et al. SSD: Single Shot Multibox илрүүлэгч. Компьютерийн харааны тухай Европын бага хурал. Springer, Cham, 2016.[2]. Lin, Kevin, et al. Хяналтгүй гүн мэдрэлийн сүлжээ бүхий авсаархан хоёртын тодорхойлогчийг сурах. Компьютерийн хараа ба хэв маягийг таних IEEE бага хурлын эмхэтгэл, 2016.[3]. https://github.com/intel-analyTIcs/BigDL

[4]. https://github.com/intel-analytics/analytics-zoo/tree/master/transform/vision[5].

Бидэнтэй холбоотой байх
Санал болгож буй нийтлэлүүд
Cases
Зогсоолын тасалбар түгээгч машинд юуг анхаарах вэ Ихэнх тохиолдолд та олон төрлийн зогсоолын тасалбар байдгийг олж мэдэх болно. Та ядрах болно.
Зогсоолын тасалбар түгээгчийг нэвтрүүлсэн. Зогсоолын тасалбар түгээгч нь хүмүүсийн бараа, үйлчилгээ худалдан авахдаа ашигладаг маш түгээмэл жетон төрөл юм. When you
Зогсоолын тасалбар түгээгч хэрхэн ажилладаг вэ: Та зогсоолын тасалбар худалдаж авснаар онлайнаар зогсоолын тасалбар худалдаж авах боломжтой, гэхдээ та дебит карт, кредит карт, чекээрээ төлбөрөө төлөх боломжтой.
Зогсоолын тасалбар түгээгчийг нэвтрүүлсэн нь зогсоолын тасалбарын төлбөрийг арилгах шинэлэг арга юм. For people w
Зогсоолын тасалбар түгээгч хэрхэн ажилладаг вэ Зогсоолын тасалбар түгээгч хэрхэн ажилладаг вэ? Зогсоолын тасалбар түгээгч ажилладаг
Зогсоолын тасалбар түгээгчийг нэвтрүүлэх нь интернет ашиглахдаа сайн туршлагатай байх шаардлагатай. Интернэтийг хэрхэн ашиглахаа мэдэхгүй байгаа хүмүүст, i
Зогсоолын тасалбар түгээгч хэрхэн ажилладаг вэ Хэрэв танд таалагдахгүй бол түүнээс холдоод орхи. Ингэж л машин унадаг хүмүүс дандаа л унадаг. The
Зогсоолын тасалбар түгээгчийн танилцуулга Зогсоолын тасалбарыг устгах олон янзын арга байдаг. Машинаа тусгай тавцан дээр байрлуулах боломжтой, өөрөөр хэлбэл
Зогсоолын тасалбар түгээгч хэрхэн ажилладаг вэ Зогсоол хийх олон арга бий. Олон хүмүүс зогсоол нь маш аюултай гэдгийг мэддэггүй. Маш олон удаа хүмүүс машинаа зогсоол a
Зогсоолын тасалбар түгээгч гэж юу вэ? Зогсоолын тасалбар түгээгчийг хүмүүс ашиглахад хэд хэдэн зүйл нөлөөлдөг. Жишээлбэл, зарим хүмүүс drivi байж болно
өгөгдөл алга
Shenzhen Tiger Wong Technology Co., Ltd нь автомашины ухаалаг зогсоолын систем, улсын дугаарыг таних систем, явган хүний ​​нэвтрэх хяналтын турник, царай таних терминал болон автомашины зогсоолын системд нэвтрэх удирдлагын шийдлийн тэргүүлэгч компани юм. LPR зогсоолын шийдэл .
өгөгдөл алга
CONTACT US

Shenzhen TigerWong Technology Co.,Ltd

Утас: +86 13717037584

И-мэйл: info@sztigerwong.com

Нэмэх: 1-р давхар, А2 байр, Цахиурын хөндийн эрчим хүчний дижитал аж үйлдвэрийн парк, №. 22 Дафу зам, Гуанлан гудамж, Лонгхуа дүүрэг,

Шэньжэнь, Гуандун муж, Хятад  

                    

Зохиогчийн эрх © 2021 Shenzhen TigerWong Technology Co.,Ltd  | Сайтын газрын зураг
Contact us
skype
whatsapp
messenger
contact customer service
Contact us
skype
whatsapp
messenger
цуаах
Customer service
detect