30001 - STATISTICA / STATISTICS
Dipartimento di Scienze delle Decisioni / Department of Decision Sciences
Per la lingua del corso verificare le informazioni sulle classi/
For the instruction language of the course see class group/s below
PIERO VERONESE
Classe 1: ELENA POLI, Classe 2: LUCA MOLTENI, Classe 3: GIANNA SERAFINA MONTI, Classe 4: CLAUDIO GIOVANNI BORRONI, Classe 5: PAOLA PAGANI, Classe 6: MATTIA VITTORIO ORESTE COZZI, Classe 7: EMILIANO SIRONI, Classe 8: ALESSANDRO RECLA, Classe 9: PIERO VERONESE, Classe 10: ELENA POLI
Classe/i impartita/e in lingua italiana
Conoscenze pregresse consigliate
Mission e Programma sintetico
MISSION
PROGRAMMA SINTETICO
Il corso si articola nei seguenti punti:
- Raccolta, organizzazione e descrizione dei dati tramite distribuzioni di frequenza, grafici e indici.
- Studio delle relazioni fra due caratteri.
- Inferenza statistica e variabilità campionaria.
- Teoria della stima puntuale e per intervallo.
- Verifica di ipotesi.
- Modello di regressione lineare semplice e cenni a quello multiplo.
Risultati di Apprendimento Attesi (RAA)
CONOSCENZA E COMPRENSIONE
- Comprendere la diversa natura dei dati.
- Distinguere le tecniche di analisi descrittiva da quelle inferenziali ed essere in grado di identificare quella più appropriata per il problema oggetto di studio.
- Riconoscere semplici modelli statistici.
CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE
- Sintetizzare in modo appropriato un insieme di dati.
- Stimare e verificare ipotesi su parametri non noti di una popolazione a partire da dati campionari.
- Costruire semplici modelli statistici, quali quelli di regressione, volti a studiare le relazioni fra le diverse variabili di interesse.
- Utilizzare il software R al fine di determinare le soluzioni dei precedenti problemi.
Modalità didattiche
- Lezioni frontali
- Esercitazioni (esercizi, banche dati, software etc.)
- Analisi casi studio / Incidents guidati (tradizionali, multimediali)
DETTAGLI
L'attività di insegnamento-apprendimento di questo corso, oltre alle tradizionali lezioni frontali, prevede lezioni/esercitazioni/tutoraggi in cui si utilizza il software R per risolvere le diverse problematiche statistiche precedentemente illustrate. In particolare durante le esercitazioni e i tutoraggi gli studenti possono utilizzare il loro pc per risolvere assieme al docente il problema proposto e interpretare i risultati. Un data-set reale è utilizzato durante tutto il corso cosicché alla fine si possa avere un esempio completo (rispetto agli strumenti illustrati) di una concreta analisi statistica.
Metodi di valutazione dell'apprendimento
Accertamento in itinere | Prove parziali | Prova generale | |
---|---|---|---|
|
x | x |
STUDENTI FREQUENTANTI E NON FREQUENTANTI
La valutazione, identica sia per studenti frequentanti che non frequentanti, avviene attraverso due possibili modalità: 1) tre prove parziali 2) uno scritto generale.
- Delle tre prove parziali, due (PP1, PP2) sono svolte in modo tradizionale e danno un punteggio massimo di 31/30, mentre una (PR) richiede che lo studente usi il software R installato sul suo pc per poter rispondere ad alcune domande che richiedono una piccola analisi di un data-set. Quest’ultima prova vale al massimo 4/30, questi punti sono aggiunti alla media ponderata delle altre due prove parziali. Il voto finale è quindi dato da: [ (PP1+PP2)/2]*(27/31)+PR.
- Una prova generale svolta in modo tradizionale (punteggio massimo 31/30). Il testo dell’esame contiene domande esplicite sul codice di R, sul suo funzionamento e sull’interpretazione dei suoi risultati. Tali domande hanno globalmente un peso pari a 4/30 di punto. Un punteggio totale di 31/30 equivale a 30/30 e lode.
Entrambe le modalità mirano a verificare tramite opportune domande:
- La capacità di identificare la metodologia corretta per risolvere un dato problema.
- La comprensione della logica sottostante una determinata procedura.
- La capacità di calcolare specifici indicatori statistici a mano e con il software.
- La capacità di proporre un modello statistico, coerente con le ipotesi e con i dati assegnati, e di implementarlo con R.
- La capacità di interpretare l'output del software.
Materiali didattici
STUDENTI FREQUENTANTI E NON FREQUENTANTI
- P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, Pearson/Prentice Hall, 2010, 2° edizione.
- Nota sulle Distribuzioni di frequenza disponibile sulla piattaforma Bboard del corso.
- Materiale specifico sull'uso del software R caricato sulla piattaforma Bboard.
PIERO VERONESE
Class 15: PIERALBERTO GUARNIERO, Class 16: MARTA ANGELICI, Class 17: DANIELE TONINI, Class 18: EMILIO GREGORI, Class 21: MAURIZIO POLI, Class 22: RENATA TRINCA COLONEL
Class group/s taught in English
Suggested background knowledge
Mission & Content Summary
MISSION
CONTENT SUMMARY
The course covers the following broad areas:
- Collection, management and summary of data using frequency distributions, graphical representations and indexes.
- Study of the relationship between two variables.
- Statistical inference and sampling variability.
- Theory of point estimation and confidence intervals.
- Hypothesis testing.
- Simple regression model and brief introduction to the multiple regression model.
Intended Learning Outcomes (ILO)
KNOWLEDGE AND UNDERSTANDING
- Recognize different types of data.
- Understand the difference between the tools of descriptive and inferential statistics, and identify the most suitable approach for the problem at hand.
- Recognize simple statistical models.
APPLYING KNOWLEDGE AND UNDERSTANDING
- Properly summarize a dataset.
- Estimate, and test hypotheses on, the unknown parameters of a population on the basis of sample data.
- Build simple statistical models, as regression models, aimed at studying the relationships between variables of interest.
- Use the R software to find the solutions to the aforementioned problems.
Teaching methods
- Face-to-face lectures
- Exercises (exercises, database, software etc.)
- Case studies /Incidents (traditional, online)
DETAILS
Beyond the traditional classroom lectures, the teaching method adopts practical sessions using the statistical software R to solve the problems previously illustrated. More specifically, during these sessions students use their pc’s to solve several problems together with the instructor. A real-world dataset is used throughout all the course, thus providing an exhaustive example (with respect to the course contents) of a practical statistical analysis.
Assessment methods
Continuous assessment | Partial exams | General exam | |
---|---|---|---|
|
x | x |
ATTENDING AND NOT ATTENDING STUDENTS
The assessment method, equal for attending and not-attending students, considers two alternative ways: 1) three partial exams, 2) a general exam.
-
Two Partial Exams (PE1,PE2) are traditional written exams (at most 31/30), while in the third one using the R software (PR), the students are asked to conduct a short data analysis session to answer some questions. This last partial exam is worth at most 4 points that are added to the weighted average grade of the remaining two partial exams. Thus the final mark is given by: [ (PE1+PE2)/2]*(27/31) + PR.
-
A general written exam (at most 31/30). The exam contains explicit questions on the code of the R software, on its working principles and on the interpretation of its output. The R-related questions are worth 4 points. A total grade of 31/30 is equivalent to 30/30 cum laude.
Both forms of the exam aim at assessing:
- The ability to identify the proper methodology to solve a given problem.
- The understanding of the logic underlying a certain procedure.
- The ability to compute appropriate statistical measures with both a pocket calculator and a statistical software.
- The ability of suggesting and implementing with R a statistical model, consistent with both the assumptions stated and the data at hand.
- The ability to understand the output from the software.
Teaching materials
ATTENDING AND NOT ATTENDING STUDENTS
- P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistics for Business and Economics, Pearson/Prentice Hall, 9th global edition.
-
Additional material document on Frequency Distributions, available on the Bboard platform.
- Specific material on the use of the R software are available on the Bboard platform since the beginning of the course.
EUGENIO MELILLI
Class group/s taught in English
Mission & Content Summary
MISSION
CONTENT SUMMARY
Elements of descriptive statistics
- Statistical variables, population and sample. Data representation and analysis through tables and charts. Frequency distributions.
- Measures of position, dispersion, concentration and association.
Elements of probability theory
- Discrete and continuous random variables. Probability distributions. Expected value and variance. Bernoulli and Gaussian distributions.
- Independent random variables, central limit theorem.
Elements of statistical inference
- Point and interval estimation of means and proportions. Interval length and confidence level.
- Hypothesis testing on means, proportions and difference of means. Level of a test. P-value. Test of independence.
Regression analysis
- Simple linear regression model. Inference on the parameters of the model. Testing the significance of the independent variable. Variability decomposition and R-square. Prediction.
- Multiple linear regression model. Inference on the parameters of the model. Testing the significance of each independent variable, of a group of variables and of the overall model. Variability decomposition and R-square. Prediction.
Intended Learning Outcomes (ILO)
KNOWLEDGE AND UNDERSTANDING
- Understand and distinguish the different types of data and the different techniques of analysis, both in a descriptive setting (through indicators and plots) and in an inferential one (using appropriate statistical models).
APPLYING KNOWLEDGE AND UNDERSTANDING
- Appropriately summarize datasets, estimate unknown population parameters and test hypothesis on them starting from sample data, construct simple statistical models (such as regression models) designed to study the relationships among variables. Give valid answers to research questions and help taking decisions using sample data.
Teaching methods
- Face-to-face lectures
- Online lectures
- Exercises (exercises, database, software etc.)
DETAILS
Exercises devoted to the analysis of data are proposed throughout the whole course, with particular enphasis on data coming from fields of primary interest for this course; to this aim the software R is used on a regular basis. Students are invited to take an active part in the analysis using their own notebook.
Assessment methods
Continuous assessment | Partial exams | General exam | |
---|---|---|---|
|
x | x |
ATTENDING AND NOT ATTENDING STUDENTS
Two partial exams or a general exam
Two partial exams
Partial exams are delivered as Blackboard Tests. The structure of the exam is the same for the two partial exams.
Each partial exam is made up by two Blackboard Tests, to be sit in sequence.
The first test is administered through Blackboard Platform for E-Learning with Lockdown Browser and Respondus Monitor.The test is made up by both multiple choice (closed-ended) questions and essay questions. Questions might include R outputs.The test lasts 50 minutes and awards up to 26.
The second test is administered through Blackboard Platform for E-Learning without Lockdown Browser and Respondus Monitor. It includes multiple choice (closed-ended) questions and essay questions. The test requires the use of R. It lasts 20 minutes and awards up to 5 points.
The first partial exam tests the students knowledge on all topics up to the lecture of the 15th October 2020, included.
The second exam tests the students knowledge on all topics studied up from lecture on the 28th October 2020, included.
General exam
The General exam tests the students knowledge on the entire course.The general exam is made up by two Blackboard Tests, to be sit in sequence.
The first test is administered through Blackboard Platform for E-Learning with Lockdown Browser and Respondus Monitor.The test is made up by both multiple choice (closed-ended) questions and essay questions. Questions might include R outputs.The test lasts 50 minutes and awards up to 26.
The second test is administered through Blackboard Platform for E-Learning without Lockdown Browser and Respondus Monitor. It includes multiple choice (closed-ended) questions and essay questions. The test requires the use of R. It lasts 20 minutes and awards up to 5 points.
Teaching materials
ATTENDING AND NOT ATTENDING STUDENTS
- Teaching notes
- Slides and Videos available on Blackboard Platform for ELearning
- Blackboard Tests, datasets and further material available on Blackboard Platform for ELearning
- Additional Reading: P. NEWBOLD, W.L. CARLSON, B.M. THORNE, Statistics for Business and Economics, Pearson.
Classe/i impartita/e in lingua italiana
Mission e Programma sintetico
MISSION
PROGRAMMA SINTETICO
Elementi di statistica descrittiva:
- Unità e carattere statistico. Popolazione e campione. Tipologie di dati.
- Raccolta, analisi e rappresentazione di dati attraverso tabelle e grafici.
- Misure di posizione, di variabilità, di concentrazione, di associazione.
Elementi di calcolo delle probabilità:
- Variabili aleatorie discrete e continue. Distribuzioni di probabilità. Valore atteso e varianza. Distribuzione bernoulliana e distribuzione normale (o gaussiana).
- Variabili aleatorie indipendenti e teorema centrale del limite.
Elementi di inferenza statistica:
- Stima puntuale e mediante intervalli di confidenza di medie e proporzioni. Coefficiente di confidenza e lunghezza di un intervallo.
- Verifica di ipotesi sulla media, sulla proporzione e sulla differenza di medie. Livello di un test. P-value. Test di indipendenza.
Modelli di regressione:
- Modello di regressione lineare semplice. Problemi inferenziali sui parametri del modello di regressione. Test per la significatività della variabile esplicativa. Scomposizione della variabilità e coefficiente di determinazione. Previsione.
- Modello di regressione lineare multipla. Problemi inferenziali sui parametri del modello di regressione. Test per la significatività delle singole variabili esplicative, di gruppi di variabili e del modello nel suo complesso. Uso di variabili esplicative qualitative. Scomposizione della variabilità e coefficiente di determinazione. Previsione.
Risultati di Apprendimento Attesi (RAA)
CONOSCENZA E COMPRENSIONE
- Comprendere e distinguere le diverse tipologie di dati e le relative tecniche di analisi, sia in ambito descrittivo (attraverso indicatori e grafici), sia in ambito inferenziale (mediante l'uso di opportuni modelli statistici).
CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE
- Sintetizzare e descrivere in modo appropriato un insieme di dati; costruire modelli probabilistico-statistici per rappresentare ed analizzare fenomeni reali; usando tali modelli, inferire, sulla base di dati campionari, su parametri incogniti della popolazione di interesse; rispondere, sempre partendo da informazioni campionarie, a domande di ricerca; usare informazioni provenienti da indagini campionarie per orientare le decisioni in ambito economico-aziendale.
Modalità didattiche
- Lezioni frontali
- Lezioni online
- Esercitazioni (esercizi, banche dati, software etc.)
DETTAGLI
Durante l'intero corso vengono svolti esercizi in cui sono proposte analisi di dati effettuate con il software R. Gli studenti possono partecipare in modo attivo a tali analisi, usando il proprio notebook/computer.
Metodi di valutazione dell'apprendimento
Accertamento in itinere | Prove parziali | Prova generale | |
---|---|---|---|
|
x | x |
STUDENTI FREQUENTANTI E NON FREQUENTANTI
L'esame può essere sostenuto mediante due prove parziali oppure, in alternativa, mediante un'unica prova generale.
1) Esame con prove parziali.
Prima prova parziale: la prova prevede due test online successivi su Blackboard; il primo test ha un punteggio massimo pari a 26, il secondo test un punteggio massimo pari a 5. Il primo dei due test, della durata di 50 minuti, richiede l’uso di Lockdown Browser e Respondus Monitor e prevede domande a risposta multipla (multiple choice questions) e domande a risposta aperta (essay questions) che vertono sul programma del corso svolto fino alla lezione del 15 Ottobre 2020. In questo primo test non è possibile l’uso del software R ma possono essere presenti, nelle domande, output del software stesso. Il secondo test, della durata di 20 minuti, non richiede l’uso di Lockdown Browser e Respondus Monitor e prevede domande a risposta multipla (multiple choice questions) e domande a risposta aperta (essay questions) che vertono sul programma del corso svolto fino alla lezione del 15 Ottobre 2020. In questo secondo test è richiesto l’uso del software R.
Seconda prova parziale: la prova prevede due test online successivi su Blackboard; il primo test ha un punteggio massimo pari a 26, il secondo test un punteggio massimo pari a 5. Il primo dei due test, della durata di 50 minuti, richiede l’uso di Lockdown Browser e Respondus Monitor e prevede domande a risposta multipla (multiple choice questions) e domande a risposta aperta (essay questions) che vertono sul programma del corso svolto a partire dalla lezione del 28 Ottobre 2020. In questo primo test non è possibile l’uso del software R ma possono essere presenti, nelle domande, output del software stesso. Il secondo test, della durata di 20 minuti, non richiede l’uso di Lockdown Browser e Respondus Monitor e prevede domande a risposta multipla (multiple choice questions) e domande a risposta aperta (essay questions) che vertono sul programma del corso svolto a partire dalla lezione del 28 Ottobre 2020. In questo secondo test è richiesto l’uso del software R.
2) Esame con una prova generale.
La prova prevede due test online successivi su Blackboard; il primo test ha un punteggio massimo pari a 26, il secondo test un punteggio massimo pari a 5. Il primo dei due test, della durata di 50 minuti, richiede l’uso di Lockdown Browser e Respondus Monitor e prevede domande a risposta multipla (multiple choice questions) e domande a risposta aperta (essay questions) che vertono sull'intero programma del corso. In questo primo test non è possibile l’uso del software R ma possono essere presenti, nelle domande, output del software stesso. Il secondo test, della durata di 20 minuti, non richiede l’uso di Lockdown Browser e Respondus Monitor e prevede domande a risposta multipla (multiple choice questions) e domande a risposta aperta (essay questions) che vertono sull'intero programma del corso. In questo secondo test è richiesto l’uso del software R.
Materiali didattici
STUDENTI FREQUENTANTI E NON FREQUENTANTI
- Note didattiche, esercizi e altro materiale disponibile su Blackboard.
- Lettura consigliata: P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, Pearson/Prentice Hall, 2010, 2° edizione.