Cursuri de pregatire Programare GPU cu OpenACC
OpenACC este un standard deschis pentru programarea eterogenă care permite rularea unui cod pe diferite platforme și dispozitive, cum ar fi procesoare multicore, GPU-uri, FPGA-uri și altele.
Acest training condus de un instructor, live (online sau la fața locului), este destinat dezvoltatorilor de la nivel începător până la nivel intermediar care doresc să folosească OpenACC pentru a programa dispozitive eterogene și să exploateze paralelismul acestora.
La finalul acestui training, participanții vor putea:
- Să configureze un mediu de dezvoltare OpenACC.
- Să scrie și să ruleze un program de bază OpenACC.
- Să adnoteze codul cu directive și clauze OpenACC.
- Să folosească API-ul și bibliotecile OpenACC.
- Să profileze, să depureze și să optimizeze programe OpenACC.
Formatul cursului
- Curs interactiv și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu de laborator live.
Opțiuni de personalizare a cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Schița de curs
Introducere
- Ce este OpenACC?
- OpenACC vs OpenCL vs CUDA vs SYCL
- Prezentare generală a caracteristicilor și arhitecturii OpenACC
- Configurarea mediului de dezvoltare
Începutul
- Crearea unui proiect OpenACC în Visual Studio Code
- Explorarea structurii și fișierelor proiectului
- Compilarea și rularea programului
- Afișarea rezultatelor cu printf și fprintf
Directive și clauze OpenACC
- Înțelegerea directivelor și clauzelor OpenACC
- Utilizarea directivelor paralele pentru crearea regiunilor paralele
- Utilizarea directivelor kernels pentru paralelism gestionat de compilator
- Utilizarea directivelor loop pentru paralelizarea buclelor
- Gestionarea mișcării datelor cu directive de date
- Sincronizarea datelor cu directive de actualizare
- Îmbunătățirea reutilizării datelor cu directive de cache
- Crearea funcțiilor pe dispozitiv cu directive de rutină
- Sincronizarea evenimentelor cu directive de așteptare
API OpenACC
- Înțelegerea rolului API-ului OpenACC
- Interogarea informațiilor și capacităților dispozitivului
- Setarea numărului și tipului dispozitivului
- Gestionarea erorilor și excepțiilor
- Crearea și sincronizarea evenimentelor
Biblioteci și interoperabilitate OpenACC
- Înțelegerea bibliotecilor și interoperabilității OpenACC
- Utilizarea bibliotecilor matematice, aleatorii și complexe
- Integrarea cu alte modele (CUDA, OpenMP, MPI)
- Integrarea cu biblioteci GPU (cuBLAS, cuFFT)
Instrumente OpenACC
- Înțelegerea instrumentelor OpenACC în dezvoltare
- Profilarea și depanarea programelor OpenACC
- Analiza performanței cu PGI Compiler, NVIDIA Nsight Systems, Allinea Forge
Optimizare
- Factori care afectează performanța programelor OpenACC
- Optimizarea localității datelor și reducerea transferurilor
- Optimizarea paralelismului și fuziunii buclelor
- Optimizarea paralelismului și fuziunii nucleelor
- Optimizarea vectorizării și auto-acordării
Rezumat și pași următori
Cerințe
- Cunoștințe de limbaj C/C++ sau Fortran și concepte de programare paralelă
- Cunoștințe de bază despre arhitectura calculatoarelor și ierarhia memoriei
- Experiență cu instrumente de linie de comandă și editori de cod
Publicul țintă
- Dezvoltatori care doresc să învețe cum să folosească OpenACC pentru a programa dispozitive eterogene și să exploateze paralelismul acestora
- Dezvoltatori care doresc să scrie cod portabil și scalabil care poate rula pe diferite platforme și dispozitive
- Programatori care doresc să exploreze aspectele de nivel înalt ale programării eterogene și să își optimizeze productivitatea codului
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Programare GPU cu OpenACC - Rezervare
Cursuri de pregatire Programare GPU cu OpenACC - Solicitare
Programare GPU cu OpenACC - Cerere de consultanta
Cursuri viitoare
Cursuri înrudite
Dezvoltarea Aplicațiilor de AI cu Huawei Ascend și CANN
21 OreHuawei Ascend este o familie de procesoare AI proiectate pentru inferență și antrenament de înaltă performanță.
Acest training condus de un instructor, live (online sau onsite), este destinat inginerilor de AI și oamenilor de știință de date de nivel intermediar care doresc să dezvolte și să optimizeze modele de rețele neuronale folosind platforma Huawei Ascend și toolkit-ul CANN.
La finalul acestui training, participanții vor putea:
- Să configureze și să pună la punct mediul de dezvoltare CANN.
- Să dezvolte aplicații AI folosind fluxurile de lucru MindSpore și CloudMatrix.
- Să optimizeze performanța pe NPU-urile Ascend folosind operatori personalizați și tiling.
- Să implementeze modele în medii de edge sau cloud.
Formatul Cursului
- Prelegere interactivă și discuții.
- Utilizare practică a Huawei Ascend și a toolkit-ului CANN în aplicații exemplu.
- Exerciții ghidate axate pe construirea, antrenarea și implementarea modelelor.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs bazat pe infrastructura sau seturile de date dumneavoastră, vă rugăm să ne contactați pentru a aranja.
Implementarea Modelelor de AI cu CANN și Procesoarele Ascend AI
14 OreCANN (Compute Architecture for Neural Networks) este stack-ul de calcul AI al Huawei pentru implementarea și optimizarea modelelor de AI pe procesoarele Ascend AI.
Acest training condus de un instructor, live (online sau la fața locului), este destinat dezvoltatorilor și inginerilor de AI de nivel intermediar care doresc să implementeze modele de AI antrenate eficient pe hardware-ul Huawei Ascend folosind toolkit-ul CANN și unelte precum MindSpore, TensorFlow sau PyTorch.
La sfârșitul acestui training, participanții vor putea:
- Să înțeleagă arhitectura CANN și rolul său în pipeline-ul de implementare a AI.
- Să convertească și să adapteze modele din framework-uri populare la formate compatibile cu Ascend.
- Să folosească unelte precum ATC, conversia de modele OM și MindSpore pentru inferență la margine și în cloud.
- Să diagnosticheze probleme de implementare și să optimizeze performanța pe hardware-ul Ascend.
Formatul Cursului
- Prezentare interactivă și demonstrație.
- Lucrări practice în laborator folosind unelte CANN și simulatoare sau dispozitive Ascend.
- Scenarii practice de implementare bazate pe modele de AI din lumea reală.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Inferență și Implementare AI cu CloudMatrix
21 OreCloudMatrix este platforma unificată de dezvoltare și implementare AI a Huawei, proiectată pentru a susține pipeline-uri de inferență scalabile și de nivel de producție.
Acest training condus de un instructor, live (online sau la fața locului), este destinat profesioniștilor AI de la nivel începător până la intermediar, care doresc să implementeze și să monitorizeze modele AI folosind platforma CloudMatrix cu integrarea CANN și MindSpore.
La finalul acestui training, participanții vor putea:
- Să utilizeze CloudMatrix pentru ambalarea, implementarea și servirea modelelor.
- Să convertească și să optimizeze modele pentru chipset-uri Ascend.
- Să configureze pipeline-uri pentru sarcini de inferență în timp real și în loturi.
- Să monitorizeze implementările și să ajusteze performanța în medii de producție.
Formatul Cursului
- Prelegere interactivă și discuții.
- Utilizare practică a CloudMatrix cu scenarii reale de implementare.
- Exerciții ghidate axate pe conversie, optimizare și scalare.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, bazat pe infrastructura AI sau mediul dumneavoastră cloud, vă rugăm să ne contactați pentru a aranja.
Programarea pe GPU cu Acceleratoarele Biren AI
21 OreAcceleratoarele Biren AI sunt GPU-uri de înaltă performanță proiectate pentru sarcini de AI și HPC, cu suport pentru antrenament și inferență la scară largă.
Această sesiune de formare condusă de un instructor (online sau la fața locului) este destinată dezvoltatorilor de nivel intermediar sau avansat care doresc să programeze și să optimizeze aplicații folosind stiva GPU proprietară Biren, cu comparații practice cu mediile bazate pe CUDA.
La sfârșitul acestei formări, participanții vor putea:
- Să înțeleagă arhitectura GPU Biren și ierarhia memoriei.
- Să configureze mediul de dezvoltare și să folosească modelul de programare Biren.
- Să traducă și să optimizeze cod în stil CUDA pentru platformele Biren.
- Să aplice tehnici de ajustare a performanței și depanare.
Formatul Cursului
- Prelegere interactivă și discuții.
- Utilizare practică a SDK-ului Biren în sarcini GPU de exemplu.
- Exerciții ghidate axate pe portare și ajustare a performanței.
Opțiuni de Personalizare a Cursului
- Pentru a solicita o formare personalizată pentru acest curs, bazată pe stiva dvs. de aplicații sau nevoile de integrare, vă rugăm să ne contactați pentru a aranja.
Dezvoltare pe Cambricon MLU cu BANGPy și Neuware
21 OreCambricon MLU (Unități de Învățare Automată) sunt cipuri AI specializate, optimizate pentru inferență și antrenament în scenarii de margine și centre de date.
Acest training condus de un instructor, live (online sau la fața locului), este destinat dezvoltatorilor de nivel intermediar care doresc să construiască și să implementeze modele AI folosind cadrul BANGPy și SDK-ul Neuware pe hardware-ul Cambricon MLU.
La sfârșitul acestui training, participanții vor putea:
- Să configureze și să pregătească mediile de dezvoltare BANGPy și Neuware.
- Să dezvolte și să optimizeze modele bazate pe Python și C++ pentru Cambricon MLU.
- Să implementeze modele pe dispozitive de margine și centre de date care rulează runtime-ul Neuware.
- Să integreze fluxuri de lucru ML cu funcționalități de accelerare specifice MLU.
Formatul Cursului
- Prelegere interactivă și discuții.
- Utilizare practică a BANGPy și Neuware pentru dezvoltare și implementare.
- Exerciții ghidate axate pe optimizare, integrare și testare.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, bazat pe modelul dvs. de dispozitiv Cambricon sau cazul de utilizare, vă rugăm să ne contactați pentru a aranja.
Introducere în CANN pentru Dezvoltatori de Cadre AI
7 OreCANN (Compute Architecture for Neural Networks) este toolkit-ul de calcul AI al Huawei, folosit pentru a compila, optimiza și implementa modele AI pe procesoarele Ascend AI.
Această formare condusă de un instructor, live (online sau la fața locului), este destinată dezvoltatorilor AI de nivel începător care doresc să înțeleagă cum se integrează CANN în ciclul de viață al modelului, de la antrenament la implementare, și cum funcționează împreună cu cadre precum MindSpore, TensorFlow și PyTorch.
La finalul acestei formări, participanții vor putea:
- Înțelege scopul și arhitectura toolkit-ului CANN.
- Să configureze un mediu de dezvoltare cu CANN și MindSpore.
- Să convertească și să implementeze un model AI simplu pe hardware-ul Ascend.
- Să dobândească cunoștințe de bază pentru viitoare proiecte de optimizare sau integrare CANN.
Formatul cursului
- Prelegere interactivă și discuții.
- Laboratoare practice cu implementarea unui model simplu.
- Parcurgere pas cu pas a lanțului de unelte CANN și a punctelor de integrare.
Opțiuni de personalizare a cursului
- Pentru a solicita o formare personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja.
CANN pentru Implementarea AI la Marginea Rețelei
14 OreSetul de instrumente Huawei Ascend CANN permite efectuarea de inferențe AI puternice pe dispozitive de margine, cum ar fi Ascend 310. CANN oferă instrumente esențiale pentru compilarea, optimizarea și implementarea modelelor în medii cu resurse de calcul și memorie limitate.
Această formare condusă de un instructor, live (online sau la fața locului), este destinată dezvoltatorilor și integratorilor AI de nivel intermediar care doresc să implementeze și să optimizeze modele pe dispozitive de margine Ascend folosind lanțul de instrumente CANN.
La finalul acestei formări, participanții vor putea:
- Pregăti și converti modele AI pentru Ascend 310 folosind instrumentele CANN.
- Construi pipeline-uri de inferență ușoare folosind MindSpore Lite și AscendCL.
- Optimiza performanța modelelor pentru medii cu resurse de calcul și memorie limitate.
- Implementa și monitoriza aplicații AI în cazuri de utilizare reală la marginea rețelei.
Formatul Cursului
- Prezentare interactivă și demonstrație.
- Lucrări practice în laborator cu modele și scenarii specifice marginii.
- Exemple live de implementare pe hardware virtual sau fizic de margine.
Opțiuni de Personalizare a Cursului
- Pentru a solicita o formare personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Înțelegerea Stivei de Calcul AI a Huawei: De la CANN la MindSpore
14 OreStiva AI a Huawei — de la SDK-ul de bază CANN până la framework-ul de nivel înalt MindSpore — oferă un mediu integrat de dezvoltare și implementare AI, optimizat pentru hardware-ul Ascend.
Acest training condus de un instructor, live (online sau la fața locului), este destinat profesioniștilor tehnici de la nivel începător până la intermediar, care doresc să înțeleagă cum componentele CANN și MindSpore lucrează împreună pentru a sprijini gestionarea ciclului de viață AI și deciziile de infrastructură.
La finalul acestui training, participanții vor putea:
- Înțelege arhitectura stratificată a stivei de calcul AI a Huawei.
- Identifica cum CANN sprijină optimizarea modelelor și implementarea la nivel de hardware.
- Evaluează framework-ul și lanțul de unelte MindSpore în raport cu alternativele din industrie.
- Poziționează stiva AI a Huawei în medii enterprise sau cloud/on-prem.
Formatul Cursului
- Prelegere interactivă și discuții.
- Demo-uri live ale sistemului și prezentări bazate pe cazuri.
- Laboratoare ghidate opționale pe fluxul modelelor de la MindSpore la CANN.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Optimizarea Performanței Rețelelor Neuronale cu CANN SDK
14 OreCANN SDK (Compute Architecture for Neural Networks) este fundația de calcul AI a Huawei care permite dezvoltatorilor să ajusteze și să optimizeze performanța rețelelor neuronale implementate pe procesoarele Ascend AI.
Acest training condus de un instructor, live (online sau onsite), este destinat dezvoltatorilor AI avansați și inginerilor de sistem care doresc să optimizeze performanța inferenței folosind setul avansat de instrumente CANN, inclusiv Graph Engine, TIK și dezvoltarea de operatori personalizați.
La finalul acestui training, participanții vor putea:
- Înțelege arhitectura de runtime a CANN și ciclul de performanță.
- Utiliza instrumente de profiling și Graph Engine pentru analiza și optimizarea performanței.
- Crea și optimiza operatori personalizați folosind TIK și TVM.
- Rezolva blocaje de memorie și îmbunătățește debitul modelului.
Formatul Cursului
- Prelegere interactivă și discuții.
- Laboratoare practice cu profiling în timp real și ajustare a operatorilor.
- Exerciții de optimizare folosind exemple de implementare în cazuri extreme.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
CANN SDK pentru Pipe-uri de Computer Vision și NLP
14 OreCANN SDK (Compute Architecture for Neural Networks) oferă instrumente puternice de implementare și optimizare pentru aplicații AI în timp real în domeniile computer vision și NLP, în special pe hardware-ul Huawei Ascend.
Acest training condus de un instructor, live (online sau la fața locului), este destinat practicienților AI de nivel intermediar care doresc să construiască, să implementeze și să optimizeze modele de vedere și limbaj folosind CANN SDK pentru cazuri de utilizare în producție.
La sfârșitul acestui training, participanții vor putea:
- Să implementeze și să optimizeze modele CV și NLP folosind CANN și AscendCL.
- Să folosească instrumentele CANN pentru a converti modele și a le integra în pipe-uri live.
- Să optimizeze performanța de inferență pentru sarcini precum detectarea, clasificarea și analiza sentimentelor.
- Să construiască pipe-uri CV/NLP în timp real pentru scenarii de implementare la margine sau în cloud.
Formatul Cursului
- Curs interactiv și demonstrație.
- Laborator practic cu implementarea modelelor și profilarea performanței.
- Proiectarea de pipe-uri live folosind cazuri reale de CV și NLP.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Construirea operatorilor AI personalizați cu CANN TIK și TVM
14 OreCANN TIK (Tensor Instruction Kernel) și Apache TVM permit optimizarea și personalizarea avansată a operatorilor de modele AI pentru hardware-ul Huawei Ascend.
Acest training condus de un instructor, live (online sau la fața locului), este destinat dezvoltatorilor de sisteme de nivel avansat care doresc să construiască, să implementeze și să ajusteze operatori personalizați pentru modele AI folosind modelul de programare TIK al CANN și integrarea compilatorului TVM.
La finalul acestui training, participanții vor putea:
- Scrie și testează operatori AI personalizați folosind TIK DSL pentru procesoarele Ascend.
- Integrează operatori personalizați în runtime-ul CANN și graful de execuție.
- Folosește TVM pentru planificarea operatorilor, auto-ajustarea și benchmarking.
- Depanează și optimizează performanța la nivel de instrucțiuni pentru modele de calcul personalizate.
Formatul cursului
- Curs interactiv și demonstrații.
- Scrierea de cod pentru operatori folosind pipeline-urile TIK și TVM.
- Testare și ajustare pe hardware-ul Ascend sau simulatoare.
Opțiuni de personalizare a cursului
- Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Migrarea Aplicațiilor CUDA pe Arhitecturi GPU Chinezești
21 OreArhitecturile GPU chinezești, cum ar fi Huawei Ascend, Biren și Cambricon MLU, oferă alternative la CUDA adaptate pentru piețele locale de AI și HPC.
Acest training condus de un instructor, live (online sau la fața locului), este destinat programatorilor avansați de GPU și specialiștilor în infrastructură care doresc să migreze și să optimizeze aplicațiile CUDA existente pentru implementare pe platforme hardware chinezești.
La sfârșitul acestui training, participanții vor putea:
- Evalua compatibilitatea sarcinilor de lucru CUDA existente cu alternativele de cipuri chinezești.
- Porta baze de cod CUDA în mediile Huawei CANN, Biren SDK și Cambricon BANGPy.
- Compara performanța și identifica punctele de optimizare pe diferite platforme.
- Aborda provocări practice în sprijinul și implementarea inter-arhitectură.
Formatul Cursului
- Prelegere interactivă și discuții.
- Laboratoare practice de traducere a codului și comparare a performanței.
- Exerciții ghidate axate pe strategii de adaptare multi-GPU.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs bazat pe platforma sau proiectul dvs. CUDA, vă rugăm să ne contactați pentru a aranja.
Optimizarea Performanțelor pe Ascend, Biren și Cambricon
21 OreAscend, Biren și Cambricon sunt platforme hardware de top pentru inteligența artificială din China, fiecare oferind instrumente unice de accelerare și profilare pentru sarcini de producție la scară largă în domeniul IA.
Acest training condus de un instructor, live (online sau la fața locului), este destinat inginerilor avansați de infrastructură și performanță în domeniul IA care doresc să optimizeze procesele de inferență și antrenare a modelelor pe mai multe platforme de cipuri AI chinezești.
La sfârșitul acestui training, participanții vor putea:
- Să efectueze benchmark-uri pe modele pe platformele Ascend, Biren și Cambricon.
- Să identifice punctele de blocaj ale sistemului și ineficiențele de memorie/calcul.
- Să aplice optimizări la nivel de graf, kernel și operator.
- Să ajusteze conductele de implementare pentru a îmbunătăți debitul și latența.
Formatul Cursului
- Prelegere interactivă și discuții.
- Utilizarea practică a instrumentelor de profilare și optimizare pe fiecare platformă.
- Exerciții ghidate axate pe scenarii practice de ajustare.
Opțiuni de Personalizare a Cursului
- Pentru a solicita un training personalizat pentru acest curs bazat pe mediul dvs. de performanță sau tipul de model, vă rugăm să ne contactați pentru a aranja.