Imputación de Series de Tiempo a través de técnicas de conglomeración utilizando características topológicas.

Ponente(s): Joaquín Desiderio López De La Cruz
En entornos industriales, la calidad de las decisiones depende críticamente de la precisión de los modelos de pronóstico. Un factor clave para minimizar el error (ej: MAPE) es garantizar que los datos de entrada estén completos y representen fielmente los patrones subyacentes. En esta charla, presentamos la metodología utilizada para mejorar series de tiempo con datos faltantes, combinando Análisis Topológico de Datos (TDA) con técnicas de clustering e imputación. Detallaremos cómo las características topológicas permiten agrupar series con comportamientos estructuralmente similares, facilitando una imputación más contextual. Además, compartiremos el pipeline implementado en Google Cloud Platform respaldado por herramientas como Python y Bitbucket para integración continua. Los resultados muestran una reducción significativa en el error de pronóstico (MAPE) frente a los resultados obtenidos sin esta metodología, demostrando que la topología de datos puede ser un aliado estratégico en la preparación de datos para IA industrial.