Mejorando el nowcasting de la inflación con datos de búsquedas en línea: Una aplicación de random forest para Colombia

Número: 
1318
Publicado: 
Authors:
Felipe Roldán-Ferrína,
Clasificación JEL: 
C14, C53, E17, E31, E37
Palabras clave: 
Inflación, pronóstico en tiempo real, pronostico, Bosques aleatorios, Tendencias de Google, Aprendizaje automático
Resumen: 

Este artículo evalúa la capacidad predictiva de un modelo de aprendizaje automático basado en Random Forest (RF), combinado con datos de Google Trends (GT), para realizar nowcasting de la inflación mensual en Colombia. El modelo propuesto, denominado RF-GT, se entrena utilizando datos históricos de inflación, indicadores macroeconómicos y actividad de búsqueda en internet. Tras la optimización de los hiperparámetros mediante validación cruzada para series de tiempo, se evalúa su desempeño fuera de muestra durante el periodo 2023–2024. Los resultados se comparan con enfoques tradicionales, incluidos los modelos SARIMA, regresiones Ridge y Lasso, así como con los pronósticos profesionales de la Encuesta Mensual de Expectativas (EME) del Banco de la República. En términos de precisión predictiva, el modelo RF-GT supera de forma consistente a los modelos estadísticos y muestra un desempeño comparable al pronóstico mediano de los analistas, con la ventaja adicional de generar predicciones aproximadamente semana y media antes. Estos hallazgos destacan el valor práctico de integrar fuentes de datos alternativas y técnicas de aprendizaje automático en los sistemas de monitoreo de inflación de economías emergentes.

Enfoque

Este trabajo propone la construcción de un indicador simple para hacer pronósticos de muy corto plazo (lo que se conoce también como nowcasting) de la inflación mensual en Colombia. Combina dos innovaciones relevantes: datos de Google Trends (GT), que capturan en tiempo real las búsquedas relacionadas con inflación, y Random Forest (RF), un método de aprendizaje automático que recientemente ha tenido gran acogida en la estimación de pronósticos económicos. La metodología empleada es sencilla, fácilmente actualizable y potencialmente aplicable a otros países, integrando información alternativa con variables macroeconómicas tradicionales para anticipar la inflación con mayor oportunidad.

Contribución

El trabajo aporta una nueva herramienta para el monitoreo oportuno de la inflación en Colombia, siendo el primer estudio que integra Google Trends con Random Forest para este propósito en el país. La incorporación de datos de búsquedas digitales complementa los indicadores económicos tradicionales, intentando estimar con relativa precisión el dato de inflación con alrededor de un mes de anticipación. Esta combinación innovadora abre vías para el uso de nuevas fuentes y técnicas para la construcción de pronósticos que soporten el análisis para la conducción de la política económica.

Los resultados evidencian la utilidad de combinar técnicas de aprendizaje automático con fuentes alternativas de información para generar pronósticos oportunos y comparables con los del mercado.

Resultados

El indicador propuesto (RF-GT) supera en precisión a métodos de series de tiempo tradicionales (SARIMA), y otras técnicas alternativas de regresión (Lasso y Ridge) en pronósticos de inflación con un mes de anticipación. En comparación con la mediana de los pronósticos de los analistas financieros encuestados por el Banco de la República, el RF-GT muestra un error levemente mayor, pero sin diferencias estadísticamente significativas. Estos resultados evidencian la utilidad de combinar técnicas de aprendizaje automático con fuentes alternativas de información para generar pronósticos oportunos y comparables con los del mercado. El análisis de importancia de variables indica que los factores más relevantes para el modelo son los rezagos de inflación y la frecuencia de búsqueda del término “precios” en Google, por encima de indicadores macroeconómicos tradicionales como la oferta monetaria o la tasa interbancaria.