Cursuri de pregatire Programarea GPU-urilor NVIDIA - Extins
Acest curs de instruire live, condus de un instructor, acoperă modul de programare a GPU-urilor pentru calcul paralel, cum să folosești diverse platforme, cum să lucrezi cu platforma CUDA și funcționalitățile acesteia, precum și cum să aplici diverse tehnici de optimizare folosind CUDA. Unele dintre aplicații includ învățare profundă, analiză de date, procesare de imagini și aplicații de inginerie.
Schița de curs
Introducere
Înțelegerea fundamentelor metodologiei de calcul eterogen
De ce calcul paralel? Înțelegerea necesității calculului paralel
Procesoare Multi-Core - Arhitectură și proiectare
Introducere în fire de execuție, noțiuni de bază și concepte fundamentale ale programării paralele
Înțelegerea proceselor fundamentale de optimizare a software-ului pentru GPU
OpenMP - Un standard pentru programarea paralelă bazată pe directive
Exerciții practice / Demonstrație a diverselor programe pe mașini multicore
Introducere în calculul pe GPU
GPU-uri pentru calcul paralel
Modelul de programare a GPU-urilor
Exerciții practice / Demonstrație a diverselor programe pe GPU
SDK, toolkit și configurarea mediului pentru GPU
Lucrul cu diverse biblioteci
Demonstrație a GPU-urilor și a uneltelor cu programe de exemplu și OpenACC
Înțelegerea modelului de programare CUDA
Învățarea arhitecturii CUDA
Explorarea și configurarea mediilor de dezvoltare CUDA
Lucrul cu API-ul de runtime CUDA
Înțelegerea modelului de memorie CUDA
Explorarea caracteristicilor suplimentare ale API-ului CUDA
Acces eficient la memoria globală în CUDA: Optimizarea memoriei globale
Optimizarea transferurilor de date în CUDA folosind fluxuri CUDA
Utilizarea memoriei partajate în CUDA
Înțelegerea și utilizarea operațiunilor și instrucțiunilor atomice în CUDA
Studiu de caz: Procesare de bază a imaginilor digitale cu CUDA
Lucrul cu programarea multi-GPU
Profilare avansată a hardware-ului și eșantionare pe NVIDIA / CUDA
Utilizarea API-ului CUDA Dynamic Parallelism pentru lansarea dinamică a kernel-urilor
Rezumat și concluzii
Cerințe
- Programare în C
- Linux GCC
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Programarea GPU-urilor NVIDIA - Extins - Rezervare
Cursuri de pregatire Programarea GPU-urilor NVIDIA - Extins - Solicitare
Programarea GPU-urilor NVIDIA - Extins - Cerere de consultanta
Cerere de consultanta
Mărturii (1)
Energia și umorul instrucționarului.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Curs - NVIDIA GPU Programming - Extended
Tradus de catre o masina
Cursuri viitoare
Cursuri înrudite
Dezvoltarea Aplicațiilor AI cu Huawei Ascend și CANN
21 OreHuawei Ascend este o familie de procesoare AI proiectate pentru inferență și antrenament de înaltă performanță.
Această formare condusă de un instructor, live (online sau la fața locului), este destinată inginerilor AI și oamenilor de știință de date de nivel intermediar care doresc să dezvolte și să optimizeze modele de rețele neuronale folosind platforma Huawei Ascend și toolkit-ul CANN.
La finalul acestei formări, participanții vor putea:
- Să configureze și să seteze mediul de dezvoltare CANN.
- Să dezvolte aplicații AI folosind fluxurile de lucru MindSpore și CloudMatrix.
- Să optimizeze performanța pe NPU-urile Ascend folosind operatori personalizați și tiling.
- Să implementeze modele în medii de tip edge sau cloud.
Formatul Cursului
- Prezentare interactivă și discuții.
- Utilizare practică a platformei Huawei Ascend și a toolkit-ului CANN în aplicații exemplu.
- Exerciții ghidate axate pe construirea, antrenarea și implementarea modelelor.
Opțiuni de Personalizare a Cursului
- Pentru a solicita o formare personalizată pentru acest curs bazată pe infrastructura sau seturile de date ale dumneavoastră, vă rugăm să ne contactați pentru a aranja.
Implementarea Modelelor de AI cu CANN și Procesoarele Ascend AI
14 OreCANN (Compute Architecture for Neural Networks) este stack-ul de calcul AI al Huawei pentru implementarea și optimizarea modelelor de AI pe procesoarele Ascend AI.
Acest training condus de un instructor, live (online sau la fața locului), este destinat dezvoltatorilor și inginerilor de AI de nivel intermediar care doresc să implementeze modele de AI antrenate eficient pe hardware-ul Huawei Ascend folosind toolkit-ul CANN și unelte precum MindSpore, TensorFlow sau PyTorch.
La sfârșitul acestui training, participanții vor putea:
- Să înțeleagă arhitectura CANN și rolul său în pipeline-ul de implementare a AI.
- Să convertească și să adapteze modele din framework-uri populare la formate compatibile cu Ascend.
- Să folosească unelte precum ATC, conversia de modele OM și MindSpore pentru inferență la margine și în cloud.
- Să diagnosticheze probleme de implementare și să optimizeze performanța pe hardware-ul Ascend.
Formatul Cursului
- Prezentare interactivă și demonstrație.
- Lucrări practice în laborator folosind unelte CANN și simulatoare sau dispozitive Ascend.
- Scenarii practice de implementare bazate pe modele de AI din lumea reală.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
GPU Programming pe Biren AI Accelerators
21 OreAccelerațorii AI Biren sunt dispozitive de înaltă performanță GPU concepute pentru sarcini de lucru AI și HPC, cu susținere pentru antrenament la scară largă și inferență.
Acest training live, condus de un instrucțuator (online sau în prezență), este destinat dezvoltatorilor de nivel intermediar până avansat care dorește să programeze și să optimizeze aplicații folosind stack-ul proprietar GPU al Birien, cu comparații practice cu mediu CUDA.
La sfârșitul acestui training, participanții vor putea:
- Comprende arhitectura Biren GPU și ierarhia memoriei.
- Configurați mediul de dezvoltare și utilizați modelul de programare al Birien.
- Traduceți și optimizați codul CUDA pentru platformele Biren.
- Aplicați tehnici de ajustare a performanței și de depurare.
Format al cursului
- Lecturi interactive și discuții.
- Utilizarea practică a SDK-ului Biren în sarcini de lucru GPU exemple.
- Exerciții guiite dedicate portabilizării și ajustării performanței.
Opțiuni de personalizare a cursului
- Pentru a solicita un training personalizat bazat pe stiva aplicațiilor sau nevoile de integrare, vă rugăm să ne contactați pentru a organiza.
Dezvoltare pe Cambricon MLU cu BANGPy și Neuware
21 OreCambricon MLU (Unități de Învățare Automată) sunt cipuri AI specializate, optimizate pentru inferență și antrenament în scenarii de margine și centre de date.
Acest training condus de un instructor, live (online sau la fața locului), este destinat dezvoltatorilor de nivel intermediar care doresc să construiască și să implementeze modele AI folosind cadrul BANGPy și SDK-ul Neuware pe hardware-ul Cambricon MLU.
La sfârșitul acestui training, participanții vor putea:
- Să configureze și să pregătească mediile de dezvoltare BANGPy și Neuware.
- Să dezvolte și să optimizeze modele bazate pe Python și C++ pentru Cambricon MLU.
- Să implementeze modele pe dispozitive de margine și centre de date care rulează runtime-ul Neuware.
- Să integreze fluxuri de lucru ML cu funcționalități de accelerare specifice MLU.
Formatul Cursului
- Prelegere interactivă și discuții.
- Utilizare practică a BANGPy și Neuware pentru dezvoltare și implementare.
- Exerciții ghidate axate pe optimizare, integrare și testare.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, bazat pe modelul dvs. de dispozitiv Cambricon sau cazul de utilizare, vă rugăm să ne contactați pentru a aranja.
Introducere în CANN pentru dezvoltatori de cadre AI
7 OreCANN (Compute Architecture for Neural Networks) este un set de instrumente pentru calcul AI al Huawei folosit pentru a compila, optimiza și_deploya modelele AI pe procesorii AI Ascend.
Această formare guidată de instrucțoare (online sau în prezență) se adresează dezvoltatorilor AI la nivel începător care doresc să înțeleagă cum CANN se integrează în ciclul de viață al modelelor, din antrenament până la deploy, și cum funcționează cu cadre precum MindSpore, TensorFlow, și PyTorch.
La sfârșitul acestei formări, participanții vor putea:
- Înțelege scopul și arhitectura setului de instrumente CANN.
- Configura un mediu de dezvoltare cu CANN și MindSpore.
- Convertește și deployează o model AI simplă pe hardware-ul Ascend.
- Obține cunoștințe fundamentale pentru proiectele viitoare de optimizare sau integrare cu CANN.
Format al cursului
- Lecturi interactive și discuții.
- Laboratoare practice cu deployarea unui model simplu.
- Pas cu pas a traversării lanțului de instrumente CANN și punctelor de integrare.
Opțiuni de personalizare ale cursului
- Pentru a solicita o formare personalizată pentru acest curs, vă rugăm să ne contactați pentru a organiza.
CANN pentru Edge AI Implementare
14 OreSetul de instrumente Ascend CANN al Huawei permite inferențe puternice AI pe dispozitive la marginea rețelei, cum ar fi Ascend 310. CANN oferă instrumente esențiale pentru compilarea, optimizarea și deployul modelelor în medii cu resurse limitate de calcul și memorie.
Această antrenament sub formă de curs (online sau presencial) este destinat dezvoltatorilor AI intermediari și integratorilor care doresc să depună și să optimizeze modelele pe dispozitive la marginea rețelei folosind lanțul de instrumente CANN.
La sfârșitul antrenamentului, participantii vor putea:
- Prepara și converti modele AI pentru Ascend 310 folosind instrumentele CANN.
- Construi pipeline-uri de inferență ușoare folosind MindSpore Lite și AscendCL.
- Optimiza performanța modelelor pentru medii cu resurse limitate de calcul și memorie.
- Deploya și monitoriza aplicațiile AI în scenarii reale la marginea rețelei.
Format al cursului
- Predare interactivă și demonstrații.
- Muncă practică cu modele specifice marginii rețelei și scenarii.
- Exemple de deploy live pe hardware virtual sau fizic la marginea rețelei.
Opțiuni de personalizare a cursului
- Pentru a cere un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a organiza.
Înțelegerea Stivei de Calcul AI a Huawei: De la CANN la MindSpore
14 OreStiva AI a Huawei — de la SDK-ul de nivel scăzut CANN până la framework-ul de nivel înalt MindSpore — oferă un mediu integrat de dezvoltare și implementare AI, optimizat pentru hardware-ul Ascend.
Acest training condus de un instructor, live (online sau la fața locului), este destinat profesioniștilor tehnici de la nivel începător până la intermediar care doresc să înțeleagă cum componentele CANN și MindSpore lucrează împreună pentru a sprijini gestionarea ciclului de viață AI și deciziile de infrastructură.
La finalul acestui training, participanții vor putea:
- Înțelege arhitectura stratificată a stivei de calcul AI a Huawei.
- Identifica cum CANN sprijină optimizarea modelelor și implementarea la nivel de hardware.
- Evaluează framework-ul și lanțul de instrumente MindSpore în raport cu alternativele din industrie.
- Poziționează stiva AI a Huawei în mediile de întreprindere sau cloud/on-prem.
Formatul Cursului
- Prelegere interactivă și discuții.
- Demo-uri live ale sistemului și prezentări bazate pe cazuri.
- Laboratoare opționale ghidate pe fluxul modelelor de la MindSpore la CANN.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Optimizarea Performanței Rețelelor Neuronale cu CANN SDK
14 OreCANN SDK (Compute Architecture for Neural Networks) este fundamentul de calcul AI al Huawei, care permite dezvoltatorilor să regleze fin și să optimizeze performanța rețelelor neuronale implementate pe procesoarele Ascend AI.
Acest training condus de un instructor, live (online sau la fața locului), este destinat dezvoltatorilor AI de nivel avansat și inginerilor de sistem care doresc să optimizeze performanța de inferență folosind setul avansat de instrumente CANN, inclusiv Graph Engine, TIK și dezvoltarea de operatori personalizați.
La finalul acestui training, participanții vor putea:
- Înțelege arhitectura runtime a CANN și ciclul de viață al performanței.
- Folosi instrumente de profilare și Graph Engine pentru analiza și optimizarea performanței.
- Crea și optimiza operatori personalizați folosind TIK și TVM.
- Rezolva gâturile de gură de memorie și îmbunătăți debitul modelului.
Formatul Cursului
- Prelegere interactivă și discuții.
- Laboratoare practice cu profilare în timp real și reglare a operatorilor.
- Exerciții de optimizare folosind exemple de implementare în cazuri limită.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
CANN SDK pentru Pipe-uri de Visionare Computerizată și NLP
14 OreCANN SDK (Compute Architecture for Neural Networks) oferă instrumente puternice de implementare și optimizare pentru aplicații AI în timp real în domeniile visionării computerizate și NLP, în special pe hardware-ul Huawei Ascend.
Acest training condus de un instructor, live (online sau la fața locului), este destinat practicienilor AI de nivel intermediar care doresc să construiască, să implementeze și să optimizeze modele de visionare și limbaj folosind CANN SDK pentru cazuri de utilizare în producție.
La finalul acestui training, participanții vor putea:
- Să implementeze și să optimizeze modele CV și NLP folosind CANN și AscendCL.
- Să folosească instrumentele CANN pentru a converti modele și a le integra în pipe-uri live.
- Să optimizeze performanța de inferență pentru sarcini precum detectarea, clasificarea și analiza sentimentelor.
- Să construiască pipe-uri CV/NLP în timp real pentru scenarii de implementare la margine sau în cloud.
Formatul Cursului
- Prelegere interactivă și demonstrație.
- Laborator practic cu implementarea modelelor și profilarea performanței.
- Proiectarea pipe-urilor live folosind cazuri reale de CV și NLP.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Construirea operatorilor AI personalizați cu CANN TIK și TVM
14 OreCANN TIK (Tensor Instruction Kernel) și Apache TVM permit optimizarea și personalizarea avansată a operatorilor de modele AI pentru hardware-ul Huawei Ascend.
Acest training condus de un instructor, live (online sau la fața locului), este destinat dezvoltatorilor de sisteme de nivel avansat care doresc să construiască, să implementeze și să ajusteze operatori personalizați pentru modele AI folosind modelul de programare TIK al CANN și integrarea compilatorului TVM.
La finalul acestui training, participanții vor putea:
- Scrie și testează operatori AI personalizați folosind TIK DSL pentru procesoarele Ascend.
- Integrează operatori personalizați în runtime-ul CANN și graful de execuție.
- Folosește TVM pentru planificarea operatorilor, auto-ajustarea și benchmarking.
- Depanează și optimizează performanța la nivel de instrucțiuni pentru modele de calcul personalizate.
Formatul cursului
- Curs interactiv și demonstrații.
- Scrierea de cod pentru operatori folosind pipeline-urile TIK și TVM.
- Testare și ajustare pe hardware-ul Ascend sau simulatoare.
Opțiuni de personalizare a cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Migrarea Aplicațiilor CUDA pe Arhitecturi GPU Chinezești
21 OreArhitecturile GPU chinezești, cum ar fi Huawei Ascend, Biren și Cambricon MLU, oferă alternative la CUDA adaptate pentru piețele locale de AI și HPC.
Acest training condus de un instructor, live (online sau la fața locului), este destinat programatorilor avansați de GPU și specialiștilor în infrastructură care doresc să migreze și să optimizeze aplicațiile CUDA existente pentru implementare pe platforme hardware chinezești.
La sfârșitul acestui training, participanții vor putea:
- Evalua compatibilitatea sarcinilor de lucru CUDA existente cu alternativele de cipuri chinezești.
- Porta baze de cod CUDA în mediile Huawei CANN, Biren SDK și Cambricon BANGPy.
- Compara performanța și identifica punctele de optimizare pe diferite platforme.
- Aborda provocări practice în sprijinul și implementarea inter-arhitectură.
Formatul Cursului
- Prelegere interactivă și discuții.
- Laboratoare practice de traducere a codului și comparare a performanței.
- Exerciții ghidate axate pe strategii de adaptare multi-GPU.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs bazat pe platforma sau proiectul dvs. CUDA, vă rugăm să ne contactați pentru a aranja.
Optimizarea Performanțelor pe Ascend, Biren și Cambricon
21 OreAscend, Biren și Cambricon sunt platforme hardware de top pentru AI în China, fiecare oferind instrumente unice de accelerare și profiling pentru sarcini de AI la scară de producție.
Acest training condus de un instructor, live (online sau la fața locului), este destinat inginerilor avansați de infrastructură și performanță AI care doresc să optimizeze fluxurile de lucru de inferență și antrenare a modelelor pe mai multe platforme de cipuri AI din China.
La finalul acestui training, participanții vor putea:
- Să realizeze benchmark-uri ale modelelor pe platformele Ascend, Biren și Cambricon.
- Să identifice punctele de blocare ale sistemului și ineficiențele de memorie/calcul.
- Să aplice optimizări la nivel de graf, kernel și operator.
- Să ajusteze pipeline-urile de implementare pentru a îmbunătăți debitul și latența.
Formatul Cursului
- Prelegere interactivă și discuții.
- Utilizare practică a instrumentelor de profiling și optimizare pe fiecare platformă.
- Exerciții ghidate axate pe scenarii practice de ajustare.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, bazat pe mediul dvs. de performanță sau tipul de model, vă rugăm să ne contactați pentru a aranja.