Regresión Beta Flexible para modelar fracción de agua a partir de imágenes satelitales

Autor: Julia Trinidad Reyes
Coautor(es): Dr. Inder Rafael Tecuapetla Gómez (CONACYT-CONABIO)
En los 32 estados de México hay presencia de humedales. Este ecosistema es una zona de alimentación y refugio para peces y crustáceos, funciona como filtro biológico de agua, y actúa como sistema natural para controlar inundaciones, solo por mencionar algunos de los servicios ecosistémicos que provee. Por tanto, se ha motivado un creciente interés en estudiar la dinámica de los humedales mexicanos. Por ejemplo, para la biosfera Marismas Nacionales en el estado de Nayarti se han procesado imágenes de los satélites Landsat y MODIS para estimar la fracción de agua (variable usada para determinar la extensión de un humedal y cuyo dominio es (0,1)) en esa zona; el dataset originado por estas imágenes es equivalente a aproximadamente 90 mil observaciones. Un estudio previo utilizó un modelo de regresión lineal para estimar fracción de agua en Marismas Nacionales, pero este procedimiento devenía en fracciones estimadas fuera del intervalo deseado. Para solucionar este problema proponemos el uso de un modelo general que restringe los valores de la variable respuesta al intervalo (0,1), a saber, el modelo de Regresión Beta Flexible, construido a la luz del paradigma bayesiano. Este modelo puede verse como la mezcla de dos densidades Beta parametrizadas por su media (la cual depende de 3 parámetros) y un parámetro de precisión (común para ambas mezclas). Esta parametrización permite que la media sea una función de covariables, vía una función liga en el sentido de un modelo lineal generalizado. Operativamente, para estimar este modelo se requiere la determinación de 4 densidades a posteriori lo cual es hecho a través de simulación MCMC. En particular, para la determinación de las densidades a posteriori de los parámetros de regresión utilizamos Metrópolis-Hastings y Gibbs sampling anidado. Estas rutinas han sido implementadas en el lenguaje de programación R. Pruebas de simulación muestran la eficacia de este nuevo modelo y su posterior aplicación a los datos de referencia (imágenes Landsat y MODIS) corrige el problema de la obtención de fracciones fuera del dominio permitido.