Schița de curs
Defalcarea subiectelor zilnic: (Fiecare sesiune este de 2 ore)
Ziua 1: Sesiunea -1: Business Prezentare generală a motivului Big Data Business Inteligența în Telco.
- Studii de caz de la T-Mobile, Verizon etc.
- Big Data rata de adaptare în telecomunicații nord-americane și modul în care își aliniază viitorul model de afaceri și operațiunile în jurul Big Data BI
- Zona de aplicare la scară largă
- Managementul rețelelor și serviciilor
- Renunțare la clienți Management
- Data Integration și Vizualizare tablou de bord
- Managementul fraudei
- Business Generarea regulilor
- Profilarea clienților
- Impingerea anunțurilor localizate
Ziua 1: Sesiunea-2: Introducere a Big Data-1
- Principalele caracteristici ale Big Data-volum, varietate, viteză și veridicitate. Arhitectură MPP pentru volum.
- Data Warehouses – schemă statică, set de date care evoluează lent
- MPP Database precum Greenplum, Exadata, Teradata, Netezza, Vertica etc.
- Hadoop Soluții bazate – nu există condiții privind structura setului de date.
- Model tipic: HDFS, MapReduce (crunch), preluare din HDFS
- Lot - potrivit pentru analitice/non-interactive
- Volum: date în flux CEP
- Alegeri tipice – produse CEP (de exemplu, Infostreams, Apama, MarkLogic etc.)
- Mai puțin gata de producție – Storm/S4
- NoSQL Databases – (columnar și cheie-valoare): Cel mai potrivit ca adjuvant analitic la depozitul de date/baza de date
Ziua-1: Sesiunea -3: Introducere în Big Data-2
NoSQL soluții
- KV Store - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
- KV Store - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
- Magazin KV (ierarhic) - GT.m, Cache
- Magazin KV (comandat) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
- KV Cache - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua
- Magazin Tuple - Gigaspaces, Coord, Apache River
- Obiect Database - ZopeDB, DB40, Shoal
- Magazin de documente - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
- Wide Columnar Store - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI
Varietăți de date: Introducere la Data Cleaning problema în Big Data
- RDBMS – structură/schemă statică, nu promovează mediul agil, explorator.
- NoSQL – semistructurat, structură suficientă pentru a stoca date fără schema exactă înainte de stocarea datelor
- Probleme de curățare a datelor
Ziua-1: Sesiunea-4: Big Data Introducere-3: Hadoop
- Când să selectați Hadoop?
- STRUCTURAT - Depozitele/bazele de date ale întreprinderii pot stoca date masive (cu un cost), dar impun o structură (nu este bună pentru explorarea activă)
- Date SEMI STRUCTURATE – greu de făcut cu soluțiile tradiționale (DW/DB)
- Datele de depozitare = efort URIAȘ și statice chiar și după implementare
- Pentru varietate și volum de date, bazate pe hardware-ul de bază – HADOOP
- H/W mărfurilor necesare pentru a crea un Hadoop Cluster
Introducere în Map Reduce /HDFS
- MapReduce – distribuiți calcularea pe mai multe servere
- HDFS – pune datele disponibile local pentru procesul de calcul (cu redundanță)
- Date – pot fi nestructurate/fără schemă (spre deosebire de RDBMS)
- Responsabilitatea dezvoltatorului de a da sens datelor
- Programming MapReduce = lucrul cu Java (pro/contra), încărcarea manuală a datelor în HDFS
Ziua 2: Sesiunea-1.1: Spark: În baza de date distribuită în memorie
- Ce este procesarea „În memorie”?
- Spark SQL
- Spark SDK
- Spark API
- RDD
- Spark Lib
- Hanna
- Cum să migrați un sistem Hadoop existent la Spark
Ziua 2 Sesiunea -1.2: Furtuna -Procesare în timp real în Big Data
- Fluxuri
- Germeni
- Șuruburi
- Topologii
Ziua 2: Sesiunea 2: Big Data Management Sistem
- Piese în mișcare, nodurile de calcul pornesc/eșuează :ZooKeeper - Pentru servicii de configurare/coordonare/denumire
- Conductă/flux de lucru complex: Oozie – gestionați fluxul de lucru, dependențele, lanțul în margaretă
- Implementează, configura, gestionează cluster, upgrade etc (administrator de sistem): Ambari
- În cloud: Whirr
- Evoluție Big Data instrumente de platformă pentru urmărire
- Probleme de aplicare a stratului ETL
Ziua 2: Sesiunea 3: Analiza predictivă în Business Inteligență -1: Tehnici fundamentale și BI bazat pe învățarea automată:
- Introducere în învățarea automată
- Învățarea tehnicilor de clasificare
- Fișier de antrenament de pregătire Bayesian Prediction
- Câmp aleatoriu Markov
- Învățare supravegheată și nesupravegheată
- Extragerea caracteristicilor
- Suport Vector Machine
- Retea neurala
- Consolidarea învățării
- Big Data problemă cu variabile mari - Pădure aleatoare (RF)
- Învățarea reprezentării
- Invatare profunda
- Big Data Problemă de automatizare – Ansamblu multimodel RF
- Automatizare prin Soft10-M
- LDA și modelarea subiectelor
- Agile învăţare
- Învățare bazată pe agenți - Exemplu din operațiunea Telco
- Învățare distribuită – Exemplu de operare Telco
- Introducere în instrumente open source pentru analiză predictivă: R, Rapidminer, Mahut
- Laborator mai scalabil analitic-Apache Hama, Spark și CMU Graph
Ziua-2: Sesiunea-4 Ecosistemul de analiză predictivă-2: Probleme comune de analiză predictivă în Telecom
- Insight analitic
- Analiza vizualizării
- Analitică predictivă structurată
- Analiză predictivă nestructurată
- Profilarea clienților
- Motor de recomandare
- Detectarea modelelor
- Descoperirea regulilor/scenariului – eșec, fraudă, optimizare
- Descoperirea cauzei fundamentale
- Analiza sentimentelor
- CRM analitic
- Analiza rețelei
- Analiza textului
- Analiza asistată de tehnologie
- Analiza fraudelor
- Analitică în timp real
Ziua 3: Sesiunea 1: Analiza operațiunii rețelei - analiza cauzei principale a defecțiunilor rețelei, întreruperea serviciului din metadate, IPDR și CRM:
- Utilizarea CPU
- Folosirea memoriei
- Utilizarea cozii QoS
- Temperatura dispozitivului
- Eroare de interfață
- versiuni IoS
- Rutarea evenimentelor
- Variații de latență
- Analiza Syslog
- Pierdere de pachete
- Simulare de încărcare
- Inferența topologică
- Pragul de performanță
- Capcane pentru dispozitive
- Colectarea și procesarea IPDR (înregistrare detaliată IP).
- Utilizarea datelor IPDR pentru consumul de lățime de bandă a abonaților, utilizarea interfeței de rețea, starea modemului și diagnosticare
- informații HFC
Ziua 3: Sesiunea 2: Instrumente pentru analiza defecțiunilor serviciului de rețea:
- Tabloul de bord cu rezumatul rețelei: monitorizați implementările generale ale rețelei și urmăriți indicatorii cheie de performanță ai organizației dvs
- Tabloul de bord pentru analiza perioadei de vârf: înțelegeți tendințele aplicațiilor și ale abonaților care conduc la utilizarea maximă, cu granularitate specifică locației
- Tabloul de bord al eficienței de rutare: controlați costurile rețelei și construiți cazuri de afaceri pentru proiectele de capital, cu o înțelegere completă a relațiilor de interconectare și tranzit
- Tabloul de bord pentru divertisment în timp real: accesați valorile care contează, inclusiv vizionările video, durata și calitatea experienței video (QoE)
- Tabloul de bord pentru tranziția IPv6: investigați adoptarea în curs de desfășurare a IPv6 în rețeaua dvs. și obțineți informații despre aplicațiile și dispozitivele care conduc tendințele
- Studiu de caz-1: Minerul de date Alcatel-Lucent Big Network Analytics (BNA).
- Inteligență mobilă multidimensională (m.IQ6)
Ziua 3: Sesiunea 3: Big Data BI pentru Marketing/Vânzări – Înțelegerea vânzărilor/marketingului din datele de vânzări: (Toate acestea vor fi afișate cu o demonstrație analitică predictivă live)
- Pentru a identifica clienții cu cea mai mare viteză
- Pentru a identifica clienții pentru un anumit produs
- Pentru a identifica setul potrivit de produse pentru un client (Recommendation Engine)
- Tehnica segmentării pieței
- Tehnica de vânzare încrucișată și upsale
- Tehnica de segmentare a clienților
- Tehnica de prognoză a veniturilor din vânzări
Ziua 3: Sesiunea 4: BI necesară pentru biroul Telco CFO:
- Prezentare generală a Business Analytics funcționează necesare într-un birou CFO
- Analiza de risc la investiții noi
- Venituri, prognoza profitului
- Prognoza de achizitie de clienti noi
- Prognoza pierderilor
- Analiza fraudelor în domeniul financiar ( detalii sesiunea următoare )
Ziua 4: Sesiunea 1: BI pentru prevenirea fraudei de la Big Data în analitica Telco-Fraud:
- Scurgeri de lățime de bandă / fraudă de lățime de bandă
- Frauda de la furnizor/supra taxare pentru proiecte
- Fraude de rambursare/revendicare client
- Fraude de rambursare de călătorie
Ziua 4: Sesiunea 2: De la Predicția de renuntare la Prevenirea renunțării:
- 3 tipuri de abandon: activ/deliberat, rotațional/incident, pasiv involuntar
- 3 clasificare a clienților renunțăți: total, ascuns, parțial
- Înțelegerea variabilelor CRM pentru abandon
- Colectarea datelor despre comportamentul clienților
- Colectarea datelor despre percepția clienților
- Colectarea datelor demografice ale clienților
- Curățarea datelor CRM
- Date CRM nestructurate (apelul clientului, bilete, e-mailuri) și conversia acestora în date structurate pentru analiza Churn
- Social Media CRM-noua modalitate de a extrage indicele de satisfacție a clienților
- Studiu de caz-1: T-Mobile SUA: Reducere a pierderii cu 50%
Ziua 4: Sesiunea 3: Cum să utilizați analiza predictivă pentru analiza cauzei principale a nemulțumirii clienților:
- Studiu de caz -1: Legarea nemulțumirii cu probleme – Contabilitate, Eșecuri de inginerie cum ar fi întreruperea serviciului, serviciul de lățime de bandă slabă
- Studiu de caz-2: Big Data Tabloul de bord QA pentru a urmări indicele de satisfacție a clienților din diverși parametri, cum ar fi escaladarea apelurilor, criticitatea problemelor, evenimentele de întrerupere a serviciului în așteptare etc.
Ziua 4: Sesiunea 4: Big Data Tabloul de bord pentru acces rapid la diverse date și afișare:
- Integrarea platformei de aplicații existente cu Big Data Dashboard
- Big Data management
- Studiu de caz pentru Big Data Tabloul de bord: Tableau și Pentaho
- Folosiți aplicația Big Data pentru a transmite reclame bazate pe locație
- Sistem de urmărire și management
Ziua 5: Sesiunea 1: Cum se justifică Big Data implementarea BI în cadrul unei organizații:
- Definirea ROI pentru implementarea Big Data.
- Studii de caz pentru economisirea timpului analistului pentru colectarea și pregătirea datelor – creșterea creșterii productivității
- Studii de caz privind câștigul de venituri din retragerea clienților
- Câștig de venituri din anunțuri bazate pe locație și alte anunțuri direcționate
- O abordare integrată a foii de calcul pentru a calcula cca. Cheltuieli vs. Câștig/economii de venituri din implementarea Big Data.
Ziua-5: Sesiunea-2: Procedura pas cu pas pentru a înlocui sistemul de date vechi cu Big Data Sistem:
- Înțelegerea practicii Big Data Foaia de parcurs pentru migrație
- Care sunt informațiile importante necesare înainte de a proiecta o implementare Big Data.
- Care sunt diferitele moduri de a calcula volumul, viteza, varietatea și veridicitatea datelor
- Cum se estimează creșterea datelor
- Studii de caz în 2 Telco
Ziua 5: Sesiunea 3 și 4: Revizuirea Big Data furnizorilor și revizuirea produselor lor. Sesiune Q/A:
- AccentureAlcatel-Lucent
- Amazon – A9
- APTEAN (fost CDC Software)
- Cisco Sisteme
- Cloudera
- Dell
- EMC
- GoodData Corporation
- Guavus
- Hitachi Data Systems
- Hortonworks
- Huawei
- HP
- IBM
- Informatica
- Intel
- Jaspersoft
- Microsoft
- MongoDB (Anterior 10Gen)
- MU Sigma
- Netapp
- Opera Solutions
- Oracle
- Pentaho
- Platfora
- Qliktech
- Cuantic
- Rackspace
- Revoluție Analytics
- Salesforce
- SAP
- SAS Institutul
- Sisense
- Software AG/Terracotta
- Soft10 Automation
- Splunk
- Sqrrl
- Supermicro
- Tableau Software
- Teradata
- Gândiți-vă la Big Analytics
- Sisteme Tidemark
- VMware (parte a EMC)
Cerințe
- Ar trebui să aibă cunoștințe de bază despre funcționarea afacerii și sistemele de date în Telecom în domeniul lor .
- Trebuie să aibă cunoștințe de bază despre SQL/Oracle sau baze de date relaționale
- Cunoașterea de bază a statisticilor (la nivel de Excel) .
Mărturii (3)
Toate exemplele folosite și stilul de predare erau perfect adaptați chiar pentru un începător, fiind capabil să înțeleg, iar instruirea a fost atât de pașnică cât și tot timpul dispusă să facă milea extra atunci când aveam nevoie de ajutor.
Mathipa Chepape - Vodacom
Curs - Big Data Business Intelligence for Telecom and Communication Service Providers
Tradus de catre o masina
Toate exemplele folosite și stilul de predare erau perfect chiar pentru un începător. Am reușit să înțeleg și instruirea a fost atât de pașnică, întotdeauna dispusă să facă milea extra atunci când aveam nevoie de ajutor.
Mathipa Chepape - Vodacom
Curs - Big Data Business Intelligence for Telecom and Communication Service Providers
Tradus de catre o masina
Comprehanderea mai bine a datelor mari
Shaune Dennis - Vodacom
Curs - Big Data Business Intelligence for Telecom and Communication Service Providers
Tradus de catre o masina