Schița de curs

Introducere

  • Definirea "Procesării Industriale de Limbaj Natural"

Instalarea spaCy

Componentele spaCy

  • Etichetorul părților vorbe (part-of-speech tagger)
  • Recunoaștorul de entități numite (named entity recognizer)
  • Parser-ul de dependențe (dependency parser)

Prezentare generală a funcțiilor și sintaxei spaCy

Înțelegerea modelării în spaCy

  • Modelarea statistică și predicția

Folosirea Interfetei de Linie de Comandă (CLI) a lui spaCy

  • Comenzi de bază

Crearea unei aplicații simple pentru prezicerea comportamentului

Antrenarea unui nou model statistic

  • Date (pentru antrenare)
  • Etichete (etichete, entități numite, etc.)

Încărcarea modelului

  • Amestecarea și buclarea

Salvarea modelului

Furnizarea de feedback pentru model

  • Gradiente de eroare

Actualizarea modelului

  • Actualizarea recunoaștorului de entități (entity recognizer)
  • Extragerea de token-uri folosind matcher-ul bazat pe reguli

Dezvoltarea unei teorii generalizate pentru rezultatele așteptate

Studiul de caz

  • Distingerea numelor de produse de numele companiilor

Rafinarea datelor de antrenare

  • Selectarea datelor reprezentative
  • Setarea ratei dropout

Alte stiluri de antrenament

  • Trecerea texturilor raw (neelaborate)
  • Trecerea dicționarelor de anotări

Folosirea spaCy pentru preprocesarea textului în Învățarea Profundă (Deep Learning)

Integrarea spaCy cu aplicațiile legacy

Testarea și depistarea erorilor modelului spaCy

  • Importanța iterației

Implementarea modelului în producție

Monitorizarea și ajustarea modelului

Troubleshooting (rezolvarea problemelor)

Rezumat și concluzii

Cerințe

  • Experiență în programarea Python.
  • O înțelegere de bază a statisticilor.
  • Experiență cu linia de comandă (command line).

Audiență

  • Dezvoltatori
  • Savanți datelor
 14 ore

Numărul de participanți


Pret per participant

Mărturii (3)

Cursuri viitoare

Categorii înrudite