CONTROL DEL FALSE DISCOVERY RATE CON KNOCKOFF

Autor: Román Castillo Casanova
Un problema común al ajustar un modelo lineal clásico reside poder escoger variables que efectivamente enriquezcan ( o pertenezcan) al modelo y controlar la razón de falsos descubrimientos (FDR por sus siglas en inglés), para poder asegurar que los descubrimientos en verdad sean ciertos y replicables. Se presenta una reseña de forma innovadora de control de FDR y selección de variables a través de la construcción de variables knockoff en el ajuste de un modelo de regresión lineal clásico. Las variables knockoff tienen la bondad de fácil construcción con los propios datos y son capaces de imitar las estructuras de correlación de los datos originales. Con estas, se muestra la construcción de un estadístico que permite discriminar entre variables importantes y que no lo son. Se presenta los resultados de efectuar este procedimiento con un conjunto de datos sintéticos de los cuales se conoce desde un inicio las variables que pertenecen al modelo.Los resultados empíricos muestran que este método de selección de variables es más poderoso que otros criterios existentes cuando existe un alta proporciones de variables nulas