A chi si rivolge
Il corso è rivolto a chiunque voglia imparare a elaborare grandi quantità di dati in maniera distribuita. Chiunque voglia imparare a sfruttare il vantaggio competitivo dei Big Data.
Argomenti e contenuti
Introduzione - Installazione di Spark in locale con VirtualBox - Creare una macchina virtuale AWS EC2 - Creare un Cluster con AWS EMR -Utilizzare Spark con DataBricks - Il Resilient Distributed Dataset (RDD) - Analisi di 225 Milioni di Recensioni su Amazon [Laboratorio] - Il DataFrame - Analisi di 28 milioni di Recensioni di Film [Laboratorio] - Time Series - Analisi delle Azioni di Apple [Laboratorio] - Machine Learning con Spark MLlib - Kaggle e le sue API - Machine Learning Supervisionato - Regressione - Machine Learning Supervisionato - Classificazione - Sentiment Analysis sulle Recensioni di Yelp [Laboratorio] - Spark Streaming - Analisi in Tempo Reale dei Tweets pubblicati su Twitter [Laboratorio]
Obiettivi
Il corso vi consentirà di imparare a lavorare con i Big Data utilizzando Spark, il framework per il calcolo distribuito più popolare al mondo, usato in produzione da giganti come Amazon, Microsoft, Oracle, Verizon e Cisco.
Modalità e fruizione
Courseware multimediale
Certificazione
Gli attestati rilasciati permettono di acquisire competenze secondo quanto indicato dal Framework DigComp 2.1 e, quindi, in grado di attestare in maniera oggettiva le competenze digitali necessarie per operare correttamente a livello professionalizzante nel lavoro in Europa.