30001 - STATISTICA / STATISTICS
Dipartimento di Scienze delle Decisioni / Department of Decision Sciences
Per la lingua del corso verificare le informazioni sulle classi/
For the instruction language of the course see class group/s below
RAFFAELLA PICCARRETA
Classe 1: FILIPPO TRENTINI, Classe 2: LUCA MOLTENI, Classe 3: GIANNA SERAFINA MONTI, Classe 4: MATTIA VITTORIO ORESTE COZZI, Classe 5: FILIPPO TRENTINI, Classe 6: MATTIA VITTORIO ORESTE COZZI, Classe 7: EMILIANO SIRONI, Classe 8: ALESSANDRO RECLA, Classe 9: ELENA POLI, Classe 10: ELENA POLI
Classe/i impartita/e in lingua italiana
Conoscenze pregresse consigliate
Mission e Programma sintetico
MISSION
PROGRAMMA SINTETICO
Il corso si articola nei seguenti punti:
- Raccolta, organizzazione e descrizione dei dati tramite distribuzioni di frequenza, grafici e indici.
- Studio delle relazioni fra due caratteri.
- Inferenza statistica e variabilità campionaria.
- Teoria della stima puntuale e per intervallo.
- Verifica di ipotesi.
- Modello di regressione lineare semplice e multiplo.
Tutte le tecniche descrittive e inferenziali descritte nel corso verranno applicate utilizzando il software statistico R– e in particolare l’ambiente di sviluppo integrato (IDE) RStudio. Il corso prevede quindi anche lezioni dedicate all'introduzione e all'utilizzo del software
Risultati di Apprendimento Attesi (RAA)
CONOSCENZA E COMPRENSIONE
- Comprendere la diversa natura dei dati.
- Distinguere le tecniche di analisi descrittiva da quelle inferenziali ed essere in grado di identificare quella più appropriata per il problema oggetto di studio.
- Riconoscere semplici modelli statistici.
- Utilizzare il software R – e in particolare l’ambiente di sviluppo integrato (IDE) RStudio – per svolgere analisi dei dati
CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE
- Sintetizzare in modo appropriato un insieme di dati.
- Stimare e verificare ipotesi su parametri non noti di una popolazione a partire da dati campionari.
- Costruire modelli di regressione per studiare le relazioni fra le diverse variabili di interesse.
- Utilizzare il software R/RStudio per determinare le soluzioni dei precedenti problemi.
Modalità didattiche
- Lezioni frontali
- Esercitazioni (esercizi, banche dati, software etc.)
- Analisi casi studio / Incidents guidati (tradizionali, multimediali)
DETTAGLI
L'attività di insegnamento-apprendimento di questo corso prevede, oltre alle tradizionali lezioni frontali, lezioni/esercitazioni in cui si utilizza il software R – e in particolare l’ambiente di sviluppo integrato (IDE) RStudio – per analizzare le diverse tecniche statistiche illustrate. In particolare, durante le esercitazioni e i tutoraggi gli studenti dovranno utilizzare il loro pc per condurre insieme al docente analisi dei dati volte alla risoluzione di specifici problemi, e interpretare i risultati ottenuti.
Metodi di valutazione dell'apprendimento
Accertamento in itinere | Prove parziali | Prova generale | |
---|---|---|---|
|
x | x |
STUDENTI FREQUENTANTI E NON FREQUENTANTI
La valutazione, identica sia per studenti frequentanti che non frequentanti, avviene attraverso due possibili modalità: 1) due prove parziali 2) una prova generale.
Le due prove parziali sono organizzate in modo identico. In entrambe le prove verranno somministrati esercizi da risolvere manualmente (relativi a dati aggregati), domande di teoria, e domande relative all’analisi di un dataset cui rispondere utilizzando il software R/RStudio.
Ognuna delle prove parziali viene valutata con un voto massimo pari a 31/30, e si considera superata con un voto maggiore o uguale a 15. Se la prima e la seconda prova parziale sono entrambe superate, il voto finale nell’esame è dato dalla media dei voti nelle due prove. Il voto massimo è di 31/30, e l’esame si ritiene superato solo se tale voto risulta maggiore o uguale a 18. Un voto pari a 31/30 comporta l’assegnazione della lode.
Importante: gli studenti che superano le prove parziali ma che nella seconda prova parziale conseguono un voto inferiore a 18 potranno chiedere che il loro voto finale non sia registrato. Questo non vale per gli studenti che conseguono un voto inferiore a 18 nella prima prova parziale, in quanto la partecipazione alla seconda prova parziale implica l'accettazione del risultato conseguito nella prima prova.
La prova generale è articolata come le prove parziali (esercizi da svolgere manualmente, domande di teoria, domande relativa ad analisi di dati cui rispondere utilizzando il software R/RStudio). Il voto massimo è di 31/30, e l’esame si ritiene superato solo se tale voto risulta maggiore o uguale a 18. Un voto pari a 31/30 comporta l’assegnazione della lode.
Entrambe le modalità d'esame mirano a verificare:
- La capacità di identificare la metodologia corretta per risolvere un dato problema.
- La comprensione della logica sottostante una determinata procedura.
- La capacità di calcolare specifici indicatori statistici a mano e con il software.
- La capacità di proporre un modello statistico, coerente con le ipotesi e con i dati assegnati, e di implementarlo in R/RStudio.
- La capacità di interpretare l'output del software.
Materiali didattici
STUDENTI FREQUENTANTI E NON FREQUENTANTI
- P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, 9/Ed. Pearson (2021).
- Materiali integrativi distribuiti sulla piattaforma Bboard
- Materiale specifico sull'uso del software R disponibile sulla piattaforma Bboard.
RAFFAELLA PICCARRETA
Class 15: PIERALBERTO GUARNIERO, Class 16: MARTA ANGELICI, Class 17: DANIELE TONINI, Class 18: EMILIO GREGORI, Class 21: RAFFAELLA PICCARRETA, Class 22: RENATA TRINCA COLONEL
Class group/s taught in English
Suggested background knowledge
PREREQUISITES
Mission & Content Summary
MISSION
CONTENT SUMMARY
The course covers the following topics:
- Collection, management and summary of data using frequency distributions, graphical representations and summaries.
- Study of the relationship between two variables.
- Statistical inference and sampling variability.
- Theory of point estimation and confidence intervals.
- Hypothesis testing.
- Simple and multiple regression models
Note that all the descriptive and inferential tools introduced during the course will be applied to data using the statistica software R - and in particular the integrated development environment (IDE) RStudio. Therefore some lessons will be dedicated to the software.
Intended Learning Outcomes (ILO)
KNOWLEDGE AND UNDERSTANDING
- Recognize different types of data.
- Understand the difference between the tools of descriptive and inferential statistics, and identify the most suitable approach for the problem at hand.
- Recognize simple statistical models.
APPLYING KNOWLEDGE AND UNDERSTANDING
- Properly summarize a dataset.
- Estimate, and test hypotheses on, the unknown parameters of a population on the basis of sample data.
- Build simple and multiple regression models to study the relationships between variables of interest.
- Use the R software to address the aformentioned issues.
Teaching methods
- Face-to-face lectures
- Exercises (exercises, database, software etc.)
- Case studies /Incidents (traditional, online)
DETAILS
Beyond traditional classes, the course features hands-on classes, where the statistical software R - and in particular the integrated development environment (IDE) RStudio - is used to apply basic statistical analyses to data. More specifically, during these sessions students will use their laptop to address specific issues, and to interpret the obtained results.
Assessment methods
Continuous assessment | Partial exams | General exam | |
---|---|---|---|
|
x | x |
ATTENDING AND NOT ATTENDING STUDENTS
The assessment method, both for attending and not-attending students, consists of 1) two midterm exams or 2) a general exam.
The two midterms consist of theoretical questions, traditional “paper and pencil” derivation exercises (questions based on aggregated data) and on questions concerning the analysis of a data, to be answered using R/Rstudio (installed on each student’s laptop). The maximum grade in each midterm is 31/30.
To pass the exam, a grade higher than or equal to 15 is required in both midterms, and an average of at least 18 points. A final grade equal to 31 is rewarded cum laude.
Important. Students whose grade in the second midterm is lower than 18 can ask to have their final grade not registered, even if they passed the exam. This does not hold for students whose grade in the first midterm is lower than 18, because sitting for the second midterm implies acceptance of the grade in the first midterm.
The general exam is organized as the midterms, and consists of the exact same type of exercises. The maximum grade in the exam is 31/30; The exam is passed with a grade higher than or equal to 18. A final grade equal to 31 is rewarded cum laude.
The exam aims at assessing:
- The ability to identify the proper methodology to solve a given problem.
- The understanding of the logic underlying a certain procedure.
- The ability to compute appropriate statistical measures with both a pocket calculator and a statistical software.
- The ability of suggesting and implementing with R a statistical model, consistent with both the assumptions stated and the data at hand.
- The ability to understand the software output.
Teaching materials
ATTENDING AND NOT ATTENDING STUDENTS
- P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistics for Business and Economics, Pearson/Prentice Hall, 9th global edition (2019).
-
Additional material integrating the textbook, available on the Bboard platform.
- Additional material on R/Studio available on the Bboard platform.