CAS Big Data Analytics e Machine Learning
- Codice
- DTI DA
- Presentazione
- Il CAS si rivolge a professionisti interessati ad operare nel campo dell’analisi dati. Il percorso formativo forma figure professionali capaci di scegliere, elaborare e utilizzare i dati al fine di estrapolare informazioni utili per i processi e la strategia aziendale. Al termine della formazione, le persone partecipanti saranno in grado di utilizzare algoritmi, tecnologie e piattaforme per l’analisi dati e implementare attraverso l’utilizzo di data set dei modelli di classificazione, profilazione, raccomandazione o decisione.
- Obiettivi
- - Conoscere le tecnologie e le piattaforme utilizzabili per l‘analisi di Big Data
- Conoscere e imparare a utilizzare algoritmi per data analysis
- Capire e implementare modelli di classificazione, regressione, clustering e raccomandazione; usarli per analizzare grandi quantità di dati
- Conoscere il Machine Learning e imparare ad applicarlo a dei dataset
- Conoscere strumenti e piattaforme software con cui realizzare applicazioni di data analysis.
- Destinatari
- Professionisti che operano nel campo della gestione dei dati in azienda e che intendono utilizzare i dati nell’ambito della business intelligence o nella predictive analytics.
- Requisiti
- Conoscenze di base di gestione e di analisi dei dati e di programmazione. Nell’ambito di alcuni corsi verrà utilizzato il linguaggio Python, a chi non ne avrà le basi verrà indicato un tutorial da seguire prima dell’inizio del corso.
- Certificato
- Attestato di frequenza.
Certifificate of Advanced Studies SUPSI in Big Data Analytics e Machine Learning, subordinato al superamento degli esami previsti dal percorso formativo.
- Crediti di studio
- 10 ECTS
- Programma
- Modulo 1: Machine Learning e Data Mining (36 ore lezione)
- Introduzione al machine learning/data mining.
- Preparazione dei dati (discretizzazione, pulizia, dati mancanti, selezione delle variabili).
- Apprendimento supervisionato (classificatori principali e meta-classificatori: bagging, boosting).
- Valutazione empirica dei classificatori.
- Dati temporali (serie storiche).
- Cenni a bias-variance decomposition, classificazione cost-sensitive, test statistici di confronto.
- Introduzione alle reti Bayesiane.
- Grafi causali, d-separazione, probabilità condizionata.
- Esempi di casi pratici durante tutto il modulo.
Modulo 2: Tecnologie per i Big Data (28 ore-lezione)
- Hadoop Distributed File System (HDFS)
- Hadoop MapReduce
- Apache Spark
- Spark cluster manager
- Stream e event processing
- Data visualisation Tools
- Esercizi
Modulo 3: Big Data analytics con Spark (24 ore-lezione)
- Classificazione: descrizione degli algoritmi (modelli lineari, naive Bayes, alberi di decisione) e dell’implementazione Spark.
- Regressione: descrizione degli algoritmi (regressione lineare, random forest) e dell’implementazione Spark.
- Clustering: descrizione degli algoritmi (k-means, mistura di Gaussiane) e caso di studio Spark.
- Raccomandazione: descrizione degli algoritmi (collaborative filtering) e dell’implementazione in Spark.
- Caso di studio pratico: raccomandazione di film, analisi di dati di
bike sharing, sentiment analysis.
Modulo 4: Piattaforme cloud per Analytics e Machine Learning (12 ore-lezione)
Studio e utilizzo delle principali piattaforme cloud per Analytics e Machine Learning:
- Amazon AWS
- Microsoft Azure e Azure Machine Learning Studio
- Google Cloud Computing Services e Google AI and machine learning products
- Databricks
- Studi di caso
Modulo 5: Progetto finale
Il progetto finale consentirà allo studente di mettere in pratica le competenze acquisite nei moduli precedenti ed entrerà a far parte della valutazione finale dello studio. Il tema del progetto verrà proposto da uno dei docenti del corso e verrà svolto dallo studente autonomamente con interazioni e incontri periodici con il relatore
- Durata
- 100 ore-lezione più progetto personale
- Responsabile/i
- Roberto Mastropietro, Professore, Istituto sistemi informativi e networking, SUPSI
- Relatore/i
- Patrick Ceppi, docente, Istittuto Sistemi Informativi e Networking, SUPSI
Vanni Galli, ricercatore, Istittuto Sistemi Informativi e Networking, SUPSI
David Huber, Software Engineer & Researcher, Istituto Dalle Molle di Studi sull’Intelligenza Artificiale, SUPSI
- Iscrizione ai corsi
- Entro il 3 febbraio 2023
- Date
- Machine Learning e Data Mining (36 ore-lezione)
13, 16, 27 febbraio
2, 6, 9, 13, 16, 20 marzo 2023
Tecnologie per i Big Data (28 ore-lezione)
23, 27, 30 marzo
3, 6, 17, 20 aprile 2023
Big Data analytics con Spark ( 24 ore-lezione)
24, 27 aprile
4, 8, 11, 15 maggio 2023
Piattaforme Cloud per Analytics e Machine Learning (12 ore-lezione)
22, 24, maggio
1 giugno 2023
Progetto personale (24 ore-lezione)
5, 7, 12, 14, 19, 22 giugno 2023
- Orari
- 17.30-21.00
- Luogo
- SUPSI, Dipartimento tecnologie innovative
Il corso viene offerto in modalità blended learning.
- Costo
- CHF 4'800.–
Tali costi comprendono il rilascio dei certificati e la documentazione didattica
È previsto uno sconto del 10% per i soci individuali di AFTI, AITI, ATED e itSMF.
- Informazioni di contatto
- roberto.mastropietro@supsi.ch
- Informazioni
- SUPSI, Dipartimento tecnologie innovative
Polo universitario Lugano - Campus Est
Via La Santa 1
CH-6962 Lugano-Viganello
T +41 (0)58 666 66 84
dti.fc@supsi.ch
www.supsi.ch/dti
Corsi che potrebbero interessarti