Intrati in legatura

Schița de curs

Concepte și Metrici de Performanță

  • Latență, debit, consum de energie, utilizarea resurselor
  • Puncte de blocaj la nivel de sistem vs. model
  • Profilare pentru inferență vs. antrenare

Profilare pe Huawei Ascend

  • Utilizarea CANN Profiler și MindInsight
  • Diagnosticarea kernel și operator
  • Modele de descărcare și mapare a memoriei

Profilare pe Biren GPU

  • Funcții de monitorizare a performanței din Biren SDK
  • Fuziunea kernel, alinierea memoriei și cozile de execuție
  • Profilare bazată pe putere și temperatură

Profilare pe Cambricon MLU

  • Instrumente de performanță BANGPy și Neuware
  • Vizibilitate la nivel de kernel și interpretarea jurnalelor
  • Integrarea profilerului MLU cu cadrele de implementare

Optimizare la Nivel de Graf și Model

  • Strategii de tăiere și cuantizare a grafului
  • Fuziunea operatorilor și restructurarea grafului de calcul
  • Standardizarea dimensiunii de intrare și ajustarea loturilor

Optimizarea Memoriei și Kernel

  • Optimizarea layout-ului și reutilizării memoriei
  • Gestionarea eficientă a bufferelor pe diferite cipseturi
  • Tehnici de ajustare la nivel de kernel pe fiecare platformă

Practici Recomandate Cross-Platform

  • Portabilitatea performanței: strategii de abstractizare
  • Construirea de conducte de ajustare partajate pentru medii multi-chip
  • Exemplu: ajustarea unui model de detectare a obiectelor pe Ascend, Biren și MLU

Rezumat și Pași Următori

Cerințe

  • Experiență în lucrul cu conducte de antrenare sau implementare a modelelor de IA
  • Înțelegerea principiilor de calcul GPU/MLU și a optimizării modelelor
  • Familiaritate de bază cu instrumentele și metricile de profilare a performanței

Publicul țintă

  • Ingineri de performanță
  • Echipe de infrastructură pentru învățarea automată
  • Arhitecți de sisteme IA
 21 Ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite