Schița de curs

Schemă detaliată a antrenamentului

    Introducere în NLP Înțelegerea cadrelor NLP NLP Aplicații comerciale ale NLP Scraping date de pe web Lucrul cu diverse API-uri pentru a prelua date text Lucrul și stocarea corpurilor de text Salvarea conținutului și a metadatelor relevante Avantajele utilizării cursului rapid Python și NLTK Înțelegerea practică a unui corpus și a unui set de date De ce avem nevoie de un corpus? Analiza corpus Tipuri de atribute de date Formate diferite de fișiere pentru corpus Pregătirea unui set de date pentru aplicații NLP Înțelegerea structurii unei propoziții Componente ale NLP Înțelegerea limbajului natural Analiza morfologică - stem, word, token, speech tags Analiza sintactică Analiza semantică Manipularea ambiguității Preprocesarea datelor textului Corpus - text brut Sentence tokenization Stemming for raw text Lemizarea textului brut Eliminarea cuvântului oprit Propoziții brute corpus Word tokenizare Word lematizare Lucrul cu matrice Termen-Document/Document-Termen Tokenizarea textului în n-grame și propoziții Preprocesare practică și personalizată Analiza datelor text Caracteristică de bază a analizatoarelor NLP și analizării Etichetare și etichetare POS Recunoașterea entităților de nume N-grame Pungă de cuvinte Caracteristici statistice ale NLP Concepte de algebră liniară pentru NLP Teoria probabilistică pentru NLP TF-IDF Vectorizare Codoare și decodificatoare Normalizare Modele probabilistice Inginerie avansată a caracteristicilor și NLP Noțiunile de bază ale word2vec Componentele modelului word2vec Logica modelului word2vec Extinderea conceptului word2vec Aplicarea modelului word2vec Studiu de caz: Aplicarea sacului de cuvinte: rezumarea automată a textului folosind algoritmi Luhn simplificați și adevărati Clustering document, clasificare și modelare subiect Clustering document și extragerea de modele (clustering ierarhic, k-means, clustering etc.) Compararea și clasificarea documentelor folosind TFIDF, Jaccard și măsurile de distanță cosinus Clasificarea documentelor folosind Naïve Bayes și Entropia maximă Identificarea elementelor importante ale textului Reducerea dimensionalității: analiza componentelor principale, descompunerea valorii singulare factorizare matricială nenegativă Modelarea subiectelor și regăsirea informațiilor folosind analiza semantică latentă Extracția entităților, analiza sentimentelor și modelarea avansată a subiectelor Pozitiv vs negativ: grad de sentiment Teoria răspunsului la item Parte a etichetării vorbirii și aplicarea acesteia: găsirea persoanelor, locurilor și organizațiilor menționate în text Modelare avansată a subiectelor: Alocare latentă Dirichlet Studii de caz Exploatarea recenziilor nestructurate ale utilizatorilor Clasificarea sentimentelor și vizualizarea analizei produsului Data Mining jurnalele de căutare pentru modelele de utilizare Clasificarea textului Modelarea subiectelor

Cerințe

Cunoașterea și conștientizarea principiilor NLP și o apreciere a aplicațiilor AI în afaceri

  21 ore
 

Mărturii (2)

Cursuri înrudite

Smart Robots for Developers

  84 ore

Categorii înrudite