Schema della sezione

    • Aperto: giovedì, 7 novembre 2024, 07:00
      Data limite: giovedì, 14 novembre 2024, 23:59

      Utilizzando il file dati "Questionario Aula 2023_24" nella sezione Dati eseguire i seguenti punti direttamente sul file excel (con eventuali minimi commenti da inserire)

      1) Correggere le eventuali inesattezze nei dati (ad esempio numeri non riconosciuti da excel, dati evidentemente erratici, ecc)

      2) Indicare quale variabili sono quantitative e quali qualitative

      3) calcolare media e deviazione standard di due variabili quantitative a vostra scelta e commentare

      4) Provare a trasformare con il metodo della normalizzazione minmax illustrato nelle slides su data pre-processing una variabile quantitativa a vostra scelta

    • Aperto: giovedì, 21 novembre 2024, 10:03
      Data limite: venerdì, 29 novembre 2024, 02:23

      Consegnare uno script R commentato (inserendo opportuni commenti mediante il simbolo #) in cui si svolgono i seguenti punti.

      Utlizzando una variabile n uguale a 100 dove n rappresenta la numerosità campionaria di un ipotetica indagine statistica. 

      1) Utilizzare un'opportuna funzione per creare i seguenti vettori: un vettore di numeri interi da 1 a n che rappresenti gli identificativi delle 100 unità statistiche

      2) mediante il comando rnorm simulare una variabile quantitativa (vettore di tipo numeric di lunghezza n) che potrebbe essere descritta da una normale con media e deviazione standard plausibili (si veda esempio altezza fatto in aula)

      3) calcolare la media e la deviazione standard del vettore al punto 2 e inserirli in oggetti denominati opportunamente

      4) creare un vettore di lunghezza n di valori tutti uguali alla media calcolata al punto 3 

      5) creare un vettore di lunghezza n di tipo "character" di una variabile qualitativa dicotomica dove una delle due modalità ha frequenza doppia dell'altra

      6) unire i dati creati in 1, 2, 4 e 5 mediante la funzione data.frame(....) (si veda dispensa R caricata su moodle)

    • Aperto: mercoledì, 20 novembre 2024, 16:28
      Data limite: venerdì, 29 novembre 2024, 14:08

      Buongiorno,

      Vi chiederei di caricare una scansione (meglio un file pdf) del foglio che utilizzerete per rispondere ai seguenti quesiti sull'output di R di un modello di regressione multiplo

      Aggiungo il punto 

      f) interpretare i valori dei coefficienti che risultano significativi.

    • Aperto: martedì, 12 novembre 2024, 21:38
      Chiuso: lunedì, 25 novembre 2024, 23:59

      Quiz sugli argomenti che vanno fino alle slides 04 (eccetto quelle su data preparation) e includono parte del materiale su R (guardate la dispensa e/o il manuale di Iacus).

      I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 3 se risposta corretta con massimo grado di fiducia).

      Il quiz è composto da domande di varia natura, dura un massimo di 70 minuti e va completato in un'unica sessione. Ricordate che una volta avviato il quiz non si può tornare indietro sulle domande. Avviata una domanda occorre rispondere!

    • Aperto: martedì, 12 novembre 2024, 14:28
      Chiuso: domenica, 8 dicembre 2024, 23:59

      Quiz sugli argomenti inclusi nelle slides sul campionamento, nel manuale dell'ISTAT e nel materiale addizionale caricato.

      I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).

      Il quiz dura un massimo di 50 minuti e va completato in un'unica sessione. Non si può tornare indietro nelle domande. 

    • Aperto: martedì, 12 novembre 2024, 13:43
      Chiuso: martedì, 13 maggio 2025, 03:23

      Quiz sugli argomenti inclusi nelle slides sul fonti dati e preprocessing e nel pdf data preporcessing (estratto dal volume di Larose) caricato nella sezione materiale di studio

      I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).

      Il quiz dura un massimo di 45 minuti e va completato in un'unica sessione. Non si può tornare indietro nelle domande. 



    • Aperto: giovedì, 21 novembre 2024, 13:58
      Chiuso: venerdì, 24 gennaio 2025, 06:42

      Quiz su correlazione, regressione semplice e multipla. Gli argomenti riguardano sia le slides che il capitolo del libro di testo.

      I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).

      Il quiz è composto da 20 domande di varia natura, dura un massimo di 60 minuti e va completato in un'unica sessione. 

    • Report - Istruzioni

      Il report dati da consegnare entro fine giugno con discussione dei risultati nella data di appello del 5 luglio dovrà essere un file word o pdf di massimo 15 pagine che conterrà anche grafici, tabelle e copia/incolla dei comandi di R o excel usati. L'invio dovrà avvenire per posta elettronica (ddestefano@units.it).

      Il report dovrà essere ripartito nelle seguenti sezioni:

      1) Breve introduzione (max 1 pagina) su cosa conterrà il report e le variabili di interesse e punto piu importante la domanda di ricerca (cosa vogliamo conoscere attraverso l'indagine?)

      2) Eventuale spiegazione della fase di pulizia o trasformazione dati (es se è necessario sommare variabili o ricodificarne alcune, ecc)

      3) Analisi descrittive (indici, tabelle e grafici) e commento su alcune variabili di vostro interesse (non tutte!) utili a descrivere il campione 

      4) Modello di regressione multipla che risponda eventualmente alla domanda di ricerca del punto 1

      5) Uno a scelta tra:

      - Analisi in Componenti Principali per rappresentare graficamente i dati in un unico spazio ridotto

      - Analisi dei gruppi mediante il metodo delle k-medie o con metodo gerarchico e commento dei risultati (quanti gruppi avete trovato/scelto, come sono caratterizzate le unità statistiche al loro interno sulla base delle variabili a vostra disposizione)

      Lascio come facoltativa la possibilità di usare entrambi i metodi.

      NOTA: per la discussione del report ci sarebbe da preparare anche una breve presentazione del report mediante slides (cercate di stare in una decina di slides).

    • Slides 2

      Paragrafo 1.3 libro di testo (Gallucci, Leone e Berlingeri)

    • Slides Modelli

      - Modello di regressione lineare semplice - Capitolo 2 libro di testo (Gallucci, Leone e Berlingeri)

      Modello di regressione lineare multipla - Capitolo 3 libro di testo (Gallucci, Leone e Berlingeri)

      - Regressione con variabili qualitative - Paragrafi 4.1, 4.2, 4.3 libro di testo (Gallucci, Leone e Berlingeri)