Schița de curs
Introducere
- Definirea "Procesării Industriale de Limbaj Natural"
Instalarea spaCy
Componentele spaCy
- Etichetorul părților vorbe (part-of-speech tagger)
- Recunoaștorul de entități numite (named entity recognizer)
- Parser-ul de dependențe (dependency parser)
Prezentare generală a funcțiilor și sintaxei spaCy
Înțelegerea modelării în spaCy
- Modelarea statistică și predicția
Folosirea Interfetei de Linie de Comandă (CLI) a lui spaCy
- Comenzi de bază
Crearea unei aplicații simple pentru prezicerea comportamentului
Antrenarea unui nou model statistic
- Date (pentru antrenare)
- Etichete (etichete, entități numite, etc.)
Încărcarea modelului
- Amestecarea și buclarea
Salvarea modelului
Furnizarea de feedback pentru model
- Gradiente de eroare
Actualizarea modelului
- Actualizarea recunoaștorului de entități (entity recognizer)
- Extragerea de token-uri folosind matcher-ul bazat pe reguli
Dezvoltarea unei teorii generalizate pentru rezultatele așteptate
Studiul de caz
- Distingerea numelor de produse de numele companiilor
Rafinarea datelor de antrenare
- Selectarea datelor reprezentative
- Setarea ratei dropout
Alte stiluri de antrenament
- Trecerea texturilor raw (neelaborate)
- Trecerea dicționarelor de anotări
Folosirea spaCy pentru preprocesarea textului în Învățarea Profundă (Deep Learning)
Integrarea spaCy cu aplicațiile legacy
Testarea și depistarea erorilor modelului spaCy
- Importanța iterației
Implementarea modelului în producție
Monitorizarea și ajustarea modelului
Troubleshooting (rezolvarea problemelor)
Rezumat și concluzii
Cerințe
- Experiență în programarea Python.
- O înțelegere de bază a statisticilor.
- Experiență cu linia de comandă (command line).
Audiență
- Dezvoltatori
- Savanți datelor
Mărturii (3)
Faptul de a avea mai multe exerciții practice folosind date mai asemănătoare cu cele pe care le folosim în proiectele noastre (imagini satelitare în format raster)
Matthieu - CS Group
Curs - Scaling Data Analysis with Python and Dask
Tradus de catre o masina
Pregătirea și experțiza foarte bune a formatorului, comunicare perfectă în engleză. Cursul a fost practic (exerciții + împărtășire de exemple de cazuri de utilizare)
Monika - Procter & Gamble Polska Sp. z o.o.
Curs - Developing APIs with Python and FastAPI
Tradus de catre o masina
Formatorul dezvoltă formarea în funcție de ritmul participanților
Farris Chua
Curs - Data Analysis in Python using Pandas and Numpy
Tradus de catre o masina