Variables instrumentales/Sources d'endogénéité

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Chapitre

Ce chapitre explique l'endogénéité et expose les différentes sources d'endogénéité.

Introduction

La technique des variables instrumentales découle des modèles de régressions. Dans les modèles de régressions on veut estimer les paramètres associés à plusieurs variables dont on suppose qu’elles ont un effet sur une tierce variable.

La technique des variables instrumentales permet, lorsque l'information est disponible, d'estimer un paramètre qui aurait été biaisé s'il avait été estimé par la méthode des moindres carrés ordinaire .

Soit le modèle de régression linéaire :

yi=α1+α2x1i+α3x2i+ui(1).

L'hypothèse la plus importante pour l'estimation par MCO est l'absence de corrélation entre les variables explicatives et le terme d'erreur. Cette hypothèse est l'hypothèse d'exogénéité. Dans le modèle ci-dessus, les deux variables explicatives sont supposées exogènes. Dans un modèle de régression, une variable est considéré comme exogène lorsque :

H1:E(u|X)=0.

Biais de l'estimateur

Soit le modèle vu en introduction. Dans ce modèle, on va tout d’abord supposer que la variable x2 est endogène, c'est-à-dire que l’on a la relation suivante entre x2 et u :

cov(x2,u)0 ,

ce qui implique que l'hypothèse H1 n'est plus vérifiée.

Nous savons que l'estimation par MCO des paramètres α1,α2,α3 donne le résultat suivant :

α^MCO=(XX)1Xy

où X est la matrice des variables explicatives, y compris la colonne de la constante et y le vecteur de la variable expliquée.

En remplaçant y par son expression suivant le modèle de régression on obtient

α^MCO=α+(XX)1Xu.


Si nous avions pu poser l'hypothèse H1, alors nous aurions pu montrer que α^ n’est pas biaisé :

E(α^|X)=α.

Mais comme cette hypothèse n’est pas vérifiée, nous montrons que l'estimateur de α est biaisé

E(α^|X)=α+(XX)1XE(u|X).

Sources d'endogénéité

On considère généralement trois sources d'endogénéité d'une variable explicative. La première, qui est celle qui est traitée dans l'exo 1, est la variable omise.

Imaginons que, dans l'équation 1, la variable x2 est corrélée avec une variable x4 que l’on n'a pas à notre disposition. De fait, la variable x4 est comprise dans le terme d'erreur u. Ainsi, cov(x2,u)0 ce qui implique que H1 n'est plus vérifiée.

Modèle:Bas de page