526EC - STATISTICA (CORSO PROGREDITO) 2021
Schema della sezione
-
-
Le lezioni si svolgeranno in presenza e sono quindi pensate per la fruizione in presenza.
La fruizione da remoto va considerata un ripiego, le lezioni saranno disponibili in diretta e la registrazione verrà conservata, il tutto via il Team di cui al collegamento sopra oppure attraverso il codice
8s7e2skImportante: ricordate che se possibile dovete accedere ad MS Teams usando le credenziali di studente units.
Coloro che non hanno le credenziali contattino i docenti inviando una e-mail.
-
-
Si consiglia di fare riferimento al corso di "Modelli Statistici" per materiale di ripasso sul modello lineare, in particolare per gli studenti provenienti da lauree diverse da SIAFA
-
-
-
Dataset 1 File CSV
Nel documento dati.csv sono riportati per alcuni anni e stati USA le percentuali di fumatori.
Si proponga un modello per la stima dell'andamento temporale del fenomeno, valutando se e come è da tenere in conto l'eterogeneità geografica.
-
Dataset 2 File CSV
Si analizzino i dati con l'obiettivo di costruire un modello per la previsione di target (1=affetto da malattia cardiaca) in base alle altre caratteristiche rilevate: age in years; sex (1 = male; 0 = female); cp: chest pain type; trestbps: resting blood pressure (in mm Hg on admission to the hospital); chol: serum cholestoral in mg/dl; fbs: (fasting blood sugar > 120 mg/dl) (1 = true; 0 = false); restecg: resting electrocardiographic results; thalach: maximum heart rate achieved; exang: exercise induced angina (1 = yes; 0 = no); oldpeak: ST depression induced by exercise relative to rest; slope: the slope of the peak exercise ST segment; ca: number of major vessels (0-3) colored by flourosopy; thal: 3 = normal, 6 = fixed defect, 7 = reversable defect.