
5.4 Autocorrelación y matriz de covarianzas consistente
Aunque la varianza de las estimaciones de los coeficientes del modelo se suele presentar como , se trata de un caso particular. En general, la varianza de los estimadores por MCO es:
de donde se obtiene el caso particular si . Sin embargo, existen situaciones en las que el supuesto ideal de perturbaciones esféricas no se cumple.
El primer caso, llamado heterocedasticidad, ocurre cuando las perturbaciones no tienen idéntica varianza, es decir V(εi)=σ2i ≠ σ2. En esta situación Ω es una matriz diagonal, pero los elementos no nulos son diferentes. El segundo caso, que denominamos autocorrelación, consiste en que las perturbaciones no son independientes (Cov(εt,ε s) ≠ 0) y por lo tanto, los elementos de fuera de la diagonal de la matriz Ω son distintos de cero. En cualquiera de los casos mencionados, la estimación de por mínimos cuadrados produce un estimador inconsistente, que invalida los contrastes realizados sobre los coeficientes estimados.
Se ha propuesto una familia general de estimadores consistentes de la matriz de covarianzas, de manera que distintas elecciones para estimar X’ΩX producen estimaciones consistentes ante la presencia de heterocedasticidad y/o autocorrelación, siendo pioneros el de White para heterocedasticidad y el de Newey-West para el caso de heterocedasticidad y autocorrelación.
La presencia de autocorrelación, además, si se incluyen retardos de la variable explicada como explicativa, puede dar lugar a estimaciones inconsistentes del vector de parámetros. Para detectar la presencia de autocorrelación en el modelo lineal general, además de las funciones de autocorrelación simple y parcial de los residuos del modelo, se puede utilizar el contraste de Breusch-Godfrey, donde hay que especificar el orden de la autocorrelación de las perturbaciones que se desea contrastar o el más genérico contraste de Ljung-Box, cuya hipótesis nula es que la serie (de residuos en este caso) sigue un proceso de ruido blanco. Volviendo a los modelos de consumo de tabaco:
> bgtest(tabm1, 1)
Breusch-Godfrey test for serial correlation of order up to 1 data: tabm1 LM test = 8.8763, df = 1, p-value = 0.002889
> Box.test(residuals(tabm1), 6, type="Ljung-Box")
Box-Ljung test data: residuals(tabm1) X-squared = 14.3463, df = 6, p-value = 0.026
> bgtest(tabm2, 1)
Breusch-Godfrey test for serial correlation of order up to 1 data: tabm2 LM test = 2.4486, df = 1, p-value = 0.1176
> Box.test(residuals(tabm2), 6, type="Ljung-Box")
Box-Ljung test data: residuals(tabm2) X-squared = 4.9471, df = 6, p-value = 0.5506
En el modelo tabm1 existe evidencia de autocorrelación de primer orden de acuerdo con el contraste de Breusch-Godfrey y se rechaza que los residuos sean ruido blanco según el contraste de Ljung-Box, por lo que los estadísticos t de significación individual (o cualquier otro contraste) no son válidos. Sin embargo, no aparecen problemas de autocorrelación en el modelo tabm2.
Para estimar la matriz de varianzas covarianzas consistente se puede usar la función vcovHAC() (sería vcovHC() si el problema fuese sólo de heterocedasticidad). Como existen distintos estimadores consistentes, la función vcovHAC admite un argumento type para seleccionar un estimador concreto o alternativamente, utilizar la función NeweyWest() que devuelve el estimador de Newey-West de . Por su parte, la función coeftest() realiza los contrastes t habituales admitiendo diferentes estimaciones de la matriz de covarianzas de los coeficientes estimados:
> library(sandwich) > coeftest(tabm1) ## Estimador de la varianza MCO
t test of coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.0267053 0.0074777 3.5713 0.001031 ** d(log(publicidad)) -0.2627841 0.0872122 -3.0132 0.004712 ** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> coeftest(tabm1, vcov.=vcovHAC(tabm1))
t test of coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.026705 0.012354 2.1617 0.03737 * d(log(publicidad)) -0.262784 0.126461 -2.0780 0.04490 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> coeftest(tabm1, vcov.=NeweyWest(tabm1, lag=2))
t test of coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.026705 0.011400 2.3426 0.02479 * d(log(publicidad)) -0.262784 0.107444 -2.4458 0.01947 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
La inconsistencia de la matriz de covarianzas no sólo invalida los contrastes t, también cualquier contraste de hipótesis lineales presentados en la Sección 4.2 utilizando la forma de Wald, no así la forma basada en sumas residuales, que no se ven alteradas. En su momento vimos la función linearHypothesis(), que también admite un argumento vcov.= para especificar una función que calcule la matriz de covarianzas consistente o bien la propia matriz de covarianzas.















