Schița de curs

Fundamentele Python pentru sarcini cu date

  • Instalarea Python și configurarea mediului de dezvoltare
  • Fundamentele limbajului: variabile, tipuri de date, structuri de control
  • Scriverea și executarea scripturilor simple în Python

Gestionarea fișierelor: CSV și Excel

  • Citirea și scrierea fișierelor CSV folosind modulul csv și Pandas
  • Lucrul cu fișierele Excel folosind openpyxl/xlrd și Pandas
  • Exerciții practice: automatizarea conversiilor de fișiere

Introducere la Pandas

  • Noțiuni de bază ale DataFrame-urilor: creare, indexare, selecție și filtrare
  • Operații de agregare și grupare
  • Operări comune de curățare: valori lipsă, duplicate și conversii de tip

Introducere la Polars

  • Noțiuni ale Polars și caracteristici de performanță comparate cu Pandas
  • Operații de bază cu DataFrame în Polars
  • Exemplu de utilizare: când să alege Polars în loc de Pandas

Transformarea avansată a datelor (intermediar)

  • Joins complexe, funcții de fereastră și operațiuni pivot în Pandas
  • Modele eficiente de procesare a datelor cu Polars
  • Cadențarea operațiunilor și optimizarea utilizării memoriei

Automatizarea proceselor cu Python

  • Scriverea de scripturi pentru automatizarea sarcinilor repetitive și a pașilor ETL
  • Schedularea scripturilor folosind planificatorii de sisteme operativo sau planificatorii de sarcini
  • Logging, gestionarea erorilor și notificările

Pachetare a scripturilor și bune practici

  • Crearea de executabile cu PyInstaller sau instrumente similare
  • Structurarea proiectelor, mediile virtuale și gestionarea dependențelor
  • Noțiuni de bază de control al versiunilor și documentarea fluxurilor de lucru

Proiect mini-practic hands-on

  • Sarcină end-to-end: citirea fișierelor brute, curățarea și transformarea datelor, producerea ieșirilor
  • Automatizarea fluxului de lucru și pachetarea ca script executabil sau executable
  • Revizuirea și îmbunătățirea pe baza feedback-ului colegilor

Rezumat și următoarele pași

Cerințe

  • Cunoaștere basică cu concepte de programare sau dispoziție de a învăța
  • Confort în utilizarea liniei de comandă sau terminalului pentru instalarea pachetelor
  • Experiență în lucru cu tabelele de calcul (CSV/Excel)

Audiență

  • Analiști de date și personal operativ care automatizează sarcinile de date
  • Ingineri analitici care caută scripturi ETL ușoare
  • Profesionali interesați de fluxuri de lucru bazate pe Python practic
 14 ore

Numărul de participanți


Pret per participant

Mărturii (5)

Cursuri viitoare

Categorii înrudite