You are on page 1of 21

ECONOMETRIA ESERCITAZIONE 1

valentina.tonei@studio.unibo.it http://www2.dse.unibo.it/orsi/econometria

SOMMARIO
Nel corso di questa esercitazione ci occuperemo di:
Introduzione al software econometrico Gretl Statistiche descrittive Utilizzo di dataset in Gretl Esempio di analisi econometrica con dati sezionali

INTRODUZIONE A GRETL
Il software che utilizziamo per lanalisi dei dati Gretl:

Il software pu essere scaricato dal sito: http://gretl.sourceforge.net/gretl_italiano.html#dl

Nel sito troviamo:


Programma di installazione Manuali Dataset

IMPORTAZIONE DEI

DATI

I dati di interesse possono: Essere gi presenti nei dataset di Gretl Essere disponibili nel formato di Gretl Essere disponibili in altri formati
testo (.txt, .csv, ) foglio di calcolo (.xls, .ods, ) altri software econometrici (E-views, STATA )

Si carichi il file dataset_scuola.xls In questo caso abbiamo un file excel con dati sezionali. Purtroppo il software pu dare problemi nellimportazione dei dati. Per evitarli utile:
Copiare il file excel sul desktop Inserire solo le serie dei dati che ci interessano

NB: una volta che i dati sono stati importati, il dataset pu essere salvato nel formato di Gretl.

NOZIONI DI BASE SULLUTILIZZO DI GRETL


The main window men: da queste tendine possibile accedere a tutte le funzioni di Gretl The Gretl toolbar: in questa barra (posizionata in basso) sono presenti scorciatoie utili (es. alla regressione OLS) e laccesso a due finestre molto importanti :
Terminale di Gretl Finestra icone

TERMINALE DI GRETL
Dal terminale di Gretl possibile richiamare ed eseguire qualsiasi operazione che Gretl in grado di compiere. Informazioni sui comandi sono reperibili digitando:
help: se si desidera ottenere una lista dei comadi help [comando]: se si desidera ottenere una descrizione sullutilizzo di un particolare comando. Il software accompagnato da un manuale esaustivo sui comandi (Gretl command reference)
8

FINESTRA ICONE
Dalla finestra icone possibile avere accesso ad informazioni sul dataset e sui risultati ottenuti dallelaborazione dei dati (qualora siano stati salvati). In particolare: Informazioni sui dati Note di commento alla sessione Dataset (mostra le serie) Statistiche descrittive, correlazioni e grafici Modelli utilizzati per ottenere stime
9

TORNANDO ALLESEMPIO
Dataset con dati sezionali, relativi allanno 1998 in 420 distretti della California
DIST_CODE READ_SCR MATH_SCR COUNTRY DISTRICT GR_SPAN ENRL_TOT TEACHERS COMPUTERS TESTSCR COMP_STU EXPN_STU STR AVGINC EL_PCT

10

Il problema che viene posto al provveditore di un distretto scolastico il seguente: deve decidere se assumere altri insegnanti e ridurre il numero di studenti per classe, con lo scopo di incrementare il rendimento scolastico degli studenti Si tratta di confrontare i costi con i benefici.
Costi salario dei nuovi professori Benefici miglioramento del rendimento scolastico

Come analizzare la relazione?

11

OUTPUT DI GRETL
Rapporto medio studenti insegnanti (STR) Statistiche descrittive, usando le osservazioni 1 - 420 per la variabile 'str' (420 osservazioni valide) Media 19,640 Mediana 19,723 Minimo 14,000 Massimo 25,800 Scarto quadratico medio 1,8918 Coeff. di variazione 0,096322 Asimmetria -0,025365 Curtosi 0,60960 Grafico a nuvola di queste 420 osservazioni sui punteggi del test e sul rapporto studenti insegnanti Correlazione campionaria

12

OUTPUT DI GRETL:
testscr rispetto a str (con retta dei minimi quadrati) 720 Y = 699, - 2,28X

700

680

testscr

660

640

620

600 14 16 18 20 str 22 24 26

13

OUTPUT DI GRETL
Matrice di correlazione: corr(testscr, str) = -0,22636275

14

INTRODUCIAMO IL MODELLO DI
REGRESSIONE LINEARE Introduciamo un modello statistico semplice per descrivere quantitativamente questa relazione Il modello che utilizziamo il modello di regressione lineare semplice

Yi = 0 + 1 xi + altroi
Variabile indipendente o regressore Termine derrore
15

Variabile dipendente

Ipotesi del modello lineare:


Linearit: la funzione di regressione lineare, ossia yi indipendente in media da xj dove i j Omoschedasticit: la varianza condizionale costante e non varia a seconda del valore delle variabili esplicative Incorrelazione: le osservazioni yi sono tra loro incorrelate, subordinatamente a x
16

IL MODELLO DI REGRESSIONE LINEARE


CON UN SINGOLO REGRESSORE Ci a cui siamo interessati 1 che rappresenta leffetto di una variazione di del numero di studenti per classe sul punteggio al test standardizzato

TestScorei = 0 + 1STRi + i
Purtroppo non conosciamo il valore del coefficiente per la popolazione di riferimento, pertanto dobbiamo stimarlo, attraverso il metodo dei MQO
17

IL METODO DEI MINIMI QUADRATI


ORDINARI Il metodo pi utilizzato quello dei minimi quadrati ordinari Considerando il modello nei seguenti termini:

Yi = E ( yi x) + i yi = 0 + 1 xi + i
Lo stimatore dei MQO quello che fornisce i valori dei parametri della popolazione tali da minimizzare la somma dei quadrati degli scarti, cio minimizzano lerrore definito come scarto quadratico medio.

18

min S ( 0, 1 ) = ( yi 0 1 xi ) 2
0 , 1
i =1

Dalle soluzioni del sistema delle equazioni e dei troviamo le stime dei parametri 0 1 residui Nel nostro esempio otteniamo come output di Gretl relativo alla stima del modello con i MQO:
19

IL METODO DEI MQO : LOUTPUT DI GRETL


Modello 1: OLS, usando le osservazioni 1-420 Variabile dipendente: testscr coefficiente errore std. rapporto t p-value -------------------------------------------------------------const 698,933 9,46749 73,82 6,57e-242 *** str -2,27981 0,479826 -4,751 2,78e-06 *** Media var. dipendente 654,1565 SQM var. dipendente 19,05335 Somma quadr. residui 144315,5 E.S. della regressione 18,58097 R-quadro 0,051240 R-quadro corretto 0,048970 F(1, 418) 22,57511 P-value(F) 2,78e-06 Log-verosimiglianza -1822,250 Criterio di Akaike 3648,499 Criterio di Schwarz 3656,580 Hannan-Quinn 3651,693 Note: SQM = scarto quadratico medio; E.S. = errore standard
20

La pendenza della retta definita con i MQO 2.28 un incremento nel rapporto studentiinsegnanti di uno studente per classe mediamente associato a una riduzione nel punteggio di 2.28 punti. La pendenza negativa della retta indica una relazione negativa tra numero di studenti per classe e punteggio al test. Predizione perfetta? No!

21

You might also like