142SP - ANALISI DEI DATI 2024
Schema della sezione
-
-
Slides e file per la lezione del 17 ottobre. Da seguire avendo Excel installato sulla propria macchina (oppure utilizzando MS Office 365)
-
Estratto dal volume D. Larose - DISCOVERING KNOWLEDGE IN DATA, Wiley
-
Manuale ISTAT integrativo.
da leggere anche: Indagini Amministrative - Uso dei dati amministrativi per fini statistici - Raccolta dei dati amministrativi - Reperimento delle pratiche amministrative - Trasposizione del dato amministrativo in informazione statistica - Spedizione dei dati amministrativi all'ente statistico
In generale per l'esame potete saltare la parte del questionario.
-
-
Tabella per il calcolo dell'ampiezza campionaria nel caso di un proporzione considerando varianza massima (=0.25).
Si noti che per una popolazione grande (all'aumentare di N) l'ampiezza campionaria è sostanzialmente identica (e dipende solo da livello di confidenza e margine di errore accettato per le stime). Si ricordi inoltre che in tali casi (N grande) la frazione di campionamento è in genere molto bassa.
-
Esempio utilizzato in aula
-
Dati scaricati dal github del Sole 24 ore in formato CSV separati da ","
-
-
-
Aperto: giovedì, 7 novembre 2024, 07:00Data limite: giovedì, 14 novembre 2024, 23:59
Utilizzando il file dati "Questionario Aula 2023_24" nella sezione Dati eseguire i seguenti punti direttamente sul file excel (con eventuali minimi commenti da inserire)
1) Correggere le eventuali inesattezze nei dati (ad esempio numeri non riconosciuti da excel, dati evidentemente erratici, ecc)
2) Indicare quale variabili sono quantitative e quali qualitative
3) calcolare media e deviazione standard di due variabili quantitative a vostra scelta e commentare
4) Provare a trasformare con il metodo della normalizzazione minmax illustrato nelle slides su data pre-processing una variabile quantitativa a vostra scelta
-
Aperto: giovedì, 21 novembre 2024, 10:03Data limite: venerdì, 29 novembre 2024, 02:23
Consegnare uno script R commentato (inserendo opportuni commenti mediante il simbolo #) in cui si svolgono i seguenti punti.
Utlizzando una variabile n uguale a 100 dove n rappresenta la numerosità campionaria di un ipotetica indagine statistica.
1) Utilizzare un'opportuna funzione per creare i seguenti vettori: un vettore di numeri interi da 1 a n che rappresenti gli identificativi delle 100 unità statistiche
2) mediante il comando rnorm simulare una variabile quantitativa (vettore di tipo numeric di lunghezza n) che potrebbe essere descritta da una normale con media e deviazione standard plausibili (si veda esempio altezza fatto in aula)
3) calcolare la media e la deviazione standard del vettore al punto 2 e inserirli in oggetti denominati opportunamente
4) creare un vettore di lunghezza n di valori tutti uguali alla media calcolata al punto 3
5) creare un vettore di lunghezza n di tipo "character" di una variabile qualitativa dicotomica dove una delle due modalità ha frequenza doppia dell'altra
6) unire i dati creati in 1, 2, 4 e 5 mediante la funzione data.frame(....) (si veda dispensa R caricata su moodle)
-
Aperto: mercoledì, 20 novembre 2024, 16:28Data limite: venerdì, 29 novembre 2024, 14:08
Buongiorno,
Vi chiederei di caricare una scansione (meglio un file pdf) del foglio che utilizzerete per rispondere ai seguenti quesiti sull'output di R di un modello di regressione multiplo
Aggiungo il punto
f) interpretare i valori dei coefficienti che risultano significativi.
-
-
-
Scaricare la versione FREE
-
Il file riporta l'esempio di analisi descrittiva e step per interpretare il modello di regressione sui dati contenuti nelle slides del corso (file .R con commenti)
Per visualizzarlo aprire il file con RStudio o con un editor di testi
-
-
Aperto: martedì, 12 novembre 2024, 21:38Chiuso: lunedì, 25 novembre 2024, 23:59
Quiz sugli argomenti che vanno fino alle slides 04 (eccetto quelle su data preparation) e includono parte del materiale su R (guardate la dispensa e/o il manuale di Iacus).
I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 3 se risposta corretta con massimo grado di fiducia).
Il quiz è composto da domande di varia natura, dura un massimo di 70 minuti e va completato in un'unica sessione. Ricordate che una volta avviato il quiz non si può tornare indietro sulle domande. Avviata una domanda occorre rispondere!
-
Aperto: martedì, 12 novembre 2024, 14:28Chiuso: domenica, 8 dicembre 2024, 23:59
Quiz sugli argomenti inclusi nelle slides sul campionamento, nel manuale dell'ISTAT e nel materiale addizionale caricato.
I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).
Il quiz dura un massimo di 50 minuti e va completato in un'unica sessione. Non si può tornare indietro nelle domande.
-
Aperto: martedì, 12 novembre 2024, 13:43Chiuso: martedì, 13 maggio 2025, 03:23
Quiz sugli argomenti inclusi nelle slides sul fonti dati e preprocessing e nel pdf data preporcessing (estratto dal volume di Larose) caricato nella sezione materiale di studio
I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).
Il quiz dura un massimo di 45 minuti e va completato in un'unica sessione. Non si può tornare indietro nelle domande.
-
Aperto: giovedì, 21 novembre 2024, 13:58Chiuso: venerdì, 24 gennaio 2025, 06:42
Quiz su correlazione, regressione semplice e multipla. Gli argomenti riguardano sia le slides che il capitolo del libro di testo.
I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).
Il quiz è composto da 20 domande di varia natura, dura un massimo di 60 minuti e va completato in un'unica sessione.
-