Insegnamento a.a. 2024-2025

30001 - STATISTICA / STATISTICS

Dipartimento di Scienze delle Decisioni / Department of Decision Sciences


Orario di ricevimento / Student consultation hours
Orario delle lezioni / Class timetable
Calendario esami / Exam timetable

Per la lingua del corso verificare le informazioni sulle classi/
For the instruction language of the course see class group/s below
Vai alle classi / Go to class group/s: 1 - 2 - 3 - 4 - 5 - 6 - 7 - 8 - 9 - 10 - 15 - 16 - 17 - 18 - 21 - 22 - 51
CLEAM (8 cfu - I sem. - OBBC  |  SECS-S/01) - CLEF (8 cfu - I sem. - OBBC  |  SECS-S/01)
Docente responsabile dell'insegnamento / Course Director:
RAFFAELLA PICCARRETA

Classi: 1 (I sem.) - 2 (I sem.) - 3 (I sem.) - 4 (I sem.) - 5 (I sem.) - 6 (I sem.) - 7 (I sem.) - 8 (I sem.) - 9 (I sem.) - 10 (I sem.)
Docenti responsabili delle classi:
Classe 1: ELENA POLI, Classe 2: LUCA MOLTENI, Classe 3: GIANNA SERAFINA MONTI, Classe 4: MATTIA VITTORIO ORESTE COZZI, Classe 5: ELENA POLI, Classe 6: MATTIA VITTORIO ORESTE COZZI, Classe 7: EMILIANO SIRONI, Classe 8: ALESSANDRO RECLA, Classe 9: FILIPPO TRENTINI, Classe 10: FILIPPO TRENTINI

Classe/i impartita/e in lingua italiana

Conoscenze pregresse consigliate

Per frequentare con profitto l’insegnamento è fortemente consigliato avere una conoscenza di base degli elementi di teoria delle probabilità e delle variabili aleatorie, coperti nel corso Matematica Modulo 2 (Applicata) – cod. 30063. Tali argomenti si possono trovare nei capitoli 4, 5 e 6 del libro di testo del corso. In particolare si suggerisce di guardare con attenzione gli argomenti trattati nei paragrafi 5.3 e 5.7 del Capitolo 5.

Mission e Programma sintetico

MISSION

Nell'ultimo decennio si è assistito ad una rivoluzione senza precedenti nella raccolta e nella accessibilità a dati di tutti i tipi. L’analisi esplorativa dei dati ed il loro utilizzo ai fini inferenziali sta diventando sempre più importante e cruciale in ogni campo. L’affidabilità dell’analisi dei dati e delle estrapolazioni su questa basate dipende dall’adeguatezza delle procedure di sintesi e di inferenza adottate, così come dalla corretta esposizione e comunicazione dei risultati dell’analisi. Il corso si propone di fornire i primi strumenti teorici e applicati per effettuare un’analisi statistica rigorosa di un insieme di dati. Nello specifico, il corso si focalizza sulle tecniche atte alla descrizione e alla sintesi di dati di diversa natura e allo studio delle loro relazioni, sui concetti fondamentali alla base del campionamento e dell’inferenza statistica, e sulla valutazione dei rischi connessi all’estrapolazione e all’inferenza. In particolare, lo studente impara come estrarre informazioni utili dai dati e come valutarne il grado di affidabilità.

PROGRAMMA SINTETICO

Il corso si articola nei seguenti punti:

  • Raccolta, organizzazione e descrizione dei dati tramite distribuzioni di frequenza, grafici e indici.
  • Studio delle relazioni fra due caratteri.
  • Inferenza statistica e variabilità campionaria.
  • Teoria della stima puntuale e per intervallo.
  • Verifica di ipotesi.
  • Modello di regressione lineare semplice e multiplo.

 

Tutte le tecniche descrittive e inferenziali descritte nel corso verranno applicate utilizzando il software statistico R– e in particolare l’ambiente di sviluppo integrato (IDE) RStudio. Il corso prevede quindi anche lezioni dedicate all'introduzione e all'utilizzo del software 

 


Risultati di Apprendimento Attesi (RAA)

CONOSCENZA E COMPRENSIONE

Al termine dell'insegnamento, lo studente sarà in grado di...
  • Comprendere la diversa natura dei dati.
  • Distinguere le tecniche di analisi descrittiva da quelle inferenziali ed essere in grado di identificare quella più appropriata per il problema oggetto di studio.
  • Riconoscere semplici modelli statistici.
  • Utilizzare il software R – e in particolare l’ambiente di sviluppo integrato (IDE) RStudio – per svolgere analisi dei dati

 

CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE

Al termine dell'insegnamento, lo studente sarà in grado di...
  • Sintetizzare in modo appropriato un insieme di dati.
  • Stimare e verificare ipotesi su parametri non noti di una popolazione a partire da dati campionari.
  • Costruire modelli di regressione per studiare le relazioni fra le diverse variabili di interesse.
  • Utilizzare il software R/RStudio per determinare le soluzioni dei precedenti problemi.

 


Modalità didattiche

  • Lezioni
  • Esercitazioni pratiche

DETTAGLI

L'attività di insegnamento-apprendimento di questo corso prevede, oltre alle tradizionali lezioni frontali, lezioni/esercitazioni in cui si utilizza il software R – e in particolare l’ambiente di sviluppo integrato (IDE) RStudio – per analizzare le diverse tecniche statistiche illustrate. In particolare, durante le esercitazioni e i tutoraggi gli studenti dovranno utilizzare il loro pc per condurre insieme al docente analisi dei dati volte alla risoluzione di specifici problemi, e interpretare i risultati ottenuti.


Metodi di valutazione dell'apprendimento

  Accertamento in itinere Prove parziali Prova generale
  • Prova individuale scritta (tradizionale/online)
  x x

STUDENTI FREQUENTANTI E NON FREQUENTANTI

La valutazione dell’apprendimento degli studenti si basa su un esame scritto in cui gli studenti devono fornire risposte motivate a quesiti teorici, risolvere esercizi tradizionali (carta e penna) a partire da informazioni di sintesi, riportare e commentare i risultati di analisi dei dati svolte utilizzando il software R/Rstudio

L’esame mira a verificare

  • La corretta comprensione degli strumenti statistici utilizzati
  • La capacità di identificare la metodologia corretta per risolvere un dato problema.
  • La comprensione della logica sottostante una determinata procedura.
  • La capacità di calcolare specifici indicatori statistici a mano e con il software.
  • La capacità di proporre un modello statistico, coerente con le ipotesi e con i dati assegnati, e di implementarlo in R/RStudio.
  • La capacità di interpretare l'output del software.

 

Tutti gli studenti, sia frequentanti che non frequentanti e sia in corso che in debito d’esame possono sostenere l’esame in due modalità

  1. E’ possibile sostenere l’esame in due prove parziali, ognuna valutata con un punteggio massimo pari a 31/30. Ciascuna prova parziale si considera superata con un voto maggiore o uguale a 15. Se la prima e la seconda prova parziale sono entrambe superate, il voto finale nell’esame è dato dalla media dei voti nelle due prove. Una voto finale maggiore o uguale a 30.5 comporta l’assegnazione della lode.
    Importante: sono ammessi a sostenere la seconda prova parziale solo gli studenti che hanno superato la prima prova parziale. Gli studenti che  superano entrambe le prove parziali ma che nella seconda prova parziale conseguono un voto inferiore a 18 potranno chiedere che il loro voto finale non sia registrato. Questo non vale per gli studenti che conseguono un voto inferiore a 18 nella prima prova parziale, in quanto la partecipazione alla seconda prova parziale implica l'accettazione del risultato conseguito nella prima prova.
  2. In alternativa è possibile sostenere un’unica prova generale. Il voto massimo è di 31/30, e l’esame si ritiene superato solo se tale voto risulta maggiore o uguale a 18. Un voto finale nell’esame pari a 31/30 comporta l’assegnazione della lode.

 

Al fine di incentivare la partecipazione attiva degli studenti alle lezioni, gli studenti che

a) frequentano almeno il 75% delle lezioni nella prima parte del corso (prima della prima prova parziale)

e b) frequentano almeno il 75% delle lezioni nella seconda parte del corso

e c) superano l’esame nelle sessioni di gennaio o febbraio

riceveranno 1 punto aggiuntivo che si sommerà al punteggio finale ottenuto (media dei voti nelle due prove parziali o voto conseguito nella prova generale). Si noti che tale punto aggiuntivo non contribuisce all’attribuzione della lode.

Gli studenti che registrano impropriamente la propria presenza in aula – oltre alle conseguenze chiarite nell’Honor Code – perderanno insindacabile tale punto aggiuntivo. Lo stesso vale per studenti che svolgono altre attività durante le lezioni e/o che disturbano l’attività didattica. Si richiede quindi una partecipazione attenta e attiva alle lezioni.


Materiali didattici


STUDENTI FREQUENTANTI E NON FREQUENTANTI

  • P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, 9/Ed. Pearson (2021).
  • Materiali integrativi distribuiti sulla piattaforma Bboard
  • Materiale specifico sull'uso del software R disponibile sulla piattaforma Bboard. 
Modificato il 09/05/2024 10:35
BIEF (8 cfu - I sem. - OBBC  |  SECS-S/01) - BIEM (8 cfu - I sem. - OBBC  |  16 cfu SECS-S/01)
Docente responsabile dell'insegnamento / Course Director:
RAFFAELLA PICCARRETA

Classes: 15 (I sem.) - 16 (I sem.) - 17 (I sem.) - 18 (I sem.) - 21 (I sem.) - 22 (I sem.) - 51 (I sem.)
Instructors:
Class 15: PIERALBERTO GUARNIERO, Class 16: MARTA ANGELICI, Class 17: DANIELE TONINI, Class 18: VALERIO LANGE', Class 21: RAFFAELLA PICCARRETA, Class 22: RENATA TRINCA COLONEL, Class 51: PIERALBERTO GUARNIERO

Class group/s taught in English

Suggested background knowledge

For a fruitful attendance, students are strongly advised to have a basic understanding of the concepts of probability theory and random variables. Notes on these arguments (taught in course cod. 30063, Mathematics, Module 2 (Applied)) can be found in chapters 3, 4 and 5 of the course textbook. In particular it is suggested to look carefully at the topics covered in paragraphs 4.3 and 4.7 .

PREREQUISITES

For BIEM students the exam code 30001 STATISTICA / STATISTICS is a prerequisite of the exam code 30280 Applications for management For BIEF students the exam code 30001 STATISTICA / STATISTICS is a prerequisite of the exam code 30284 EMPIRICAL METHODS FOR ECONOMICS (INTRODUCTION TO ECONOMETRICS) and of the exam code 30285 EMPIRICAL METHODS FOR FINANCE (INTRODUCTION TO ECONOMETRICS FOR FINANCE)

Mission & Content Summary

MISSION

In the last decade an unprecedented revolution has taken place in the collection of and accessibility to all types of data. Exploratory data analysis, inference and prediction are becoming more and more important in almost every field. The reliability of the conclusions drawn based on the analysis of data relies on the suitability of the applied procedures, as well as on the appropriate communication of results. This course aims at providing the basic theoretical and applied tools for a rigorous statistical analysis. Specifically, the course focuses on techniques to summarize and visualize data of different types and their possible relations, as well as on basic sampling and inferential procedures, and on the assessment of the risk associated to extrapolation and inference. In particular, students will learn how to extract information from data and how to assess the reliability of such information.

CONTENT SUMMARY

The course covers the following topics:

  • Collection, management and summary of data using frequency distributions, graphical representations and summaries.
  • Study of the relationship between two variables.
  • Statistical inference and sampling variability.
  • Theory of point estimation and confidence intervals.
  • Hypothesis testing.
  • Simple and multiple regression models

 

Note that all the descriptive and inferential tools introduced during the course will be applied to data using the statistical software R - and in particular the integrated development environment (IDE) RStudio. Therefore some lessons will be dedicated to the software.


Intended Learning Outcomes (ILO)

KNOWLEDGE AND UNDERSTANDING

At the end of the course student will be able to...
  • Recognize different types of data.
  • Understand the difference between the tools of descriptive and inferential statistics, and identify the most suitable approach for the problem at hand.
  • Recognize simple statistical models.

 

APPLYING KNOWLEDGE AND UNDERSTANDING

At the end of the course student will be able to...
  • Properly summarize a dataset.
  • Estimate, and test hypotheses on, the unknown parameters of a population on the basis of sample data.
  • Build simple and multiple regression models to study the relationships  between variables of interest.
  • Use the R software to address the aforementioned issues.

Teaching methods

  • Lectures
  • Practical Exercises

DETAILS

Beyond traditional classes, the course features hands-on classes, where the statistical software R - and in particular the integrated development environment (IDE) RStudio - is used to apply basic statistical analyses to data. More specifically, during these sessions students will use their laptop to address specific issues, and to interpret the obtained results.


Assessment methods

  Continuous assessment Partial exams General exam
  • Oral individual exam
  x x
  • Written individual exam (traditional/online)
  x x

ATTENDING AND NOT ATTENDING STUDENTS

The assessment method is based on a written exam; students will answer theoretical questions, solve traditional “paper and pencil” derivation exercises (questions based on aggregated data), report and comment the results obtained by analysing data using the software R/Rstudio

The exam aims at assessing:

  • The understanding of the statistical tools introduced and used in the course
  • The ability to identify the proper methodology to solve a given problem.
  • The understanding of the logic underlying a certain procedure.
  • The ability to compute appropriate statistical measures with both a pocket calculator and a statistical software.
  • The ability of suggesting and implementing with R a statistical model, consistent with both the assumptions stated and the data at hand.
  • The ability to understand the software output.

 

All the students, both those attending and not attending, as well as students in debt, can take the exam in two ways.

 

  1. It is possible to take two midterm exams, each graded with maximum 31 points. Each midterm is passed with a grade higher or equal to 15. If both the midterms are passed, the final grade is the average of the points taken in the midterms. A final grade higher than or equal to 30.5 is rewarded cum laude.
    Important: only students who passed the first midterm can take the second midterm. Students who pass both the midterm with a grade lower than 18 in the second midterm  can ask to have their final grade not registered. This does not hold for students whose grade in the first midterm is lower than 18, because sitting for the second midterm implies acceptance of the grade in the first midterm.
  2. Alternatively, student can take a final general exam, graded with 31/30 points maximum. The exam is passed with a grade higher than or equal to 18. A final grade equal to 31 is rewarded cum laude.

 

To encourage the participation to lessons, students who

a) attend at least the 75% of the lessons in the first part of the course (before the first midterm)

and b) attend at least the 75% of the lessons in the second part of the course

and c) pass the exam in the sessions of January or February

will have 1 additional added to their final grade (average of the grades in the two midterms or grade taken in the general exam). Please note that such additional point does not contribute to the laude.

Students who improperly register their attendance – besides the consequences stated in the Honor Code – will unquestionably lose this additional point. Same holds for students who carry out other activities during the lessons and/or who disturb during the lessons. An active and attentive participation to lessons is requested.


Teaching materials


ATTENDING AND NOT ATTENDING STUDENTS

  • P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistics for Business and Economics, Pearson/Prentice Hall, 9th global edition (2019). 
  • Additional material integrating the textbook,  available on the Bboard platform.

  • Additional material on R/Studio available on the Bboard platform.

 

Last change 11/10/2024 15:12