Disegni con regressione discontinua

Da testwiki.
Vai alla navigazione Vai alla ricerca
Test di densità in McCrary (2008)[1] su dati tratti da Lee, Moretti, and Butler (2004).[2]

In econometria, la regressione discontinua è una tecnica utilizzata per stimare gli effetti di un trattamento in contesti non sperimentali. Una caratteristica peculiare di questo approccio è la presenza di una variabile, comunemente chiamata running variable, che determina l'assegnazione del trattamento se, e solo se, supera una soglia predeterminata.

La metodologia è stata inizialmente introdotta da Donald Thistlethwaite e Donald Campbell i quali hanno analizzato l'effetto delle borse di studio assegnate per meriti scolastici sui futuri risultati accademici. L'idea alla base dell'identificazione causale era che gli individui con punteggi appena al di sotto del limite (che non hanno ricevuto la borsa) rappresentavano un buon gruppo di controllo per quelli appena al di sopra del limite (che hanno ricevuto la borsa).[3]

Metodologia

Supponiamo che un'unità statistica i (uno studente) sia esposta ad un trattamento binario di={0,1} (una borsa di studio) se e solo se una variabile osservabile xi (un punteggio ad un test) sia maggiore di una soglia nota c. Quindi, di=1xic. Il modo in cui il trattamento viene assegnato all'unità statistica genera una discontinuità nell'outcome di interesse yi (i futuri risultati accademici) intorno al punto xi=c. Se l'outcome di interesse è continuo in ogni punto xic, è possibile interpretare la discontinuità dell'outcome nel punto xi=c come l'effetto causale del trattamento.

Più in generale, consideriamo il seguente modello empirico:

yi=β0+β1di+β2xi+β3ωi+ϵi

Dove ωi rappresenta le variabili di controllo e ϵi è il termine di errore. Dato il modello empirico in esame, l'effetto causale del trattamento sull'outcome (il parametro β1) è identificato dalla seguente differenza:

limxic+E[yi]limxicE[yi]

Validità delle Ipotesi

Una regressione discontinua identifica l'effetto causale di un trattamento se e solo se le unità statistiche non hanno un preciso controllo della variabile di assegnazione. Più formalmente, utilizzando la notazione introdotta nel precedente paragrafo, diciamo che gli individui hanno un controllo impreciso sulla running variable x, se le funzione di densità di x ed ω sono continue. La presenza di controllo impreciso implica necessariamente che tutte le caratteristiche predeterminate osservate e non osservate avranno distribuzioni identiche su entrambi i lati di c. Quindi, la discontinuità dell'output al punto x=c (che è possibile calcolare attraverso i limiti esposti in precedenza grazie la continuità delle funzioni di densità) identifica necessariamente l'effetto causale.

Note

Bibliografia

Collegamenti esterni

Template:Portale