Mientras las Administraciones Públicas españolas continúan sin ser capaces de proporcionar unas interfaces homogéneas y modernas para que cualquier analista pueda acceder a los datos disponibles, el mundo se mueve en otra dirección. Últimamente he sido consciente de la aparición de unas cuantas webs de datos que añaden una capa de depuración y visualización a [...]
He tenido el blog un poco abandonado últimamente, pero no he dejado de enredar. Lo último que he estado desarrollando con R es una aplicación web para la identificación y estimación de modelos ARIMA. La idea surgió cuando, en el primer cuatrimestre, volví a enseñar este tipo de modelos a la primera promoción del Grado [...]
Después de las entradas sobre web scraping y confianza en la política, quería presentar los indicadores de confianza en la economía y en la política que proporciona el CIS mensualmente de forma visual.
A cuenta de las recientes entradas sobre web scraping y desconfianza en los políticos, C. Gil Bellosta publicó un artículo titulado “Los principales problemas de España”. Ahora aprovecho su extracción de datos con R para hacer algunos comentarios sobre las preocupaciones de los españoles.
Los organismos públicos españoles no ponen sencillo a los analistas el trabajo con los datos que publican (que son menos de los que sería deseable en un país con verdadera transparencia). Cada entidad que publica datos lo hace con su propio formato, que en ocasiones es el de algún programa estadístico comercial (¿para cuándo formatos [...]
Actualización 5 de septiembre: Me ha llamado la Decana (Begoña García Greciano) para explicarme que los nuevos precios están aprobados para toda la UCM, no es algo que dependa de nuestra cafetería. Gracias, Begoña. Si es que tenemos cara de tontos o se nos está poniendo. El gobierno primero nos reduce el sueldo, luego lo [...]
La evolución del Indicador de Confianza en la Política elaborado por el CIS muestra un preocupante deterioro desde 1996 en que se inicia la serie.
Otro sencillo ejemplo, pero relacionado con el anterior, nos permitirá estudiar la potencia del contraste de Jarque-Bera para distintos tamaños muestrales. La potencia es la probabilidad de rechazar la hipótesis nula cuando es falsa, así que vamos a generar 1000 muestras tamaño 100 de una variable aleatoria U(0,1) y calcularemos si la nula de normalidad [...]
En R resulta especialmente cómodo programar simulaciones para estudiar propiedades estadísticas de contrastes y estimadores. En este post y los dos siguientes se presentan algunos ejemplos. Vamos a ilustrar el teorema central del límite, que en una versión sencilla podemos formular del siguiente modo. Sean Xi variables aleatorias independientes y no muy diferentes: Para una [...]
5.5 Cointegración y modelo de correción de error Se habla de cointegración entre dos series temporales cuando ambas son no estacionarias (requieren una diferencia para serlo) pero una combinación lineal de ellas sí lo es. En este caso, la combinación lineal estacionaria se puede interpretar como una relación a largo plazo e incluirla retardada en el [...]