Un enfoque basado en muestreo local para la solución del problema de Máquinas de Vectores de Soporte

Ponente(s): Roberto Bárcenas Curtis, Dr. Adolfo Quiroz Salazar y Dr. Joaquín Ortega Sanchez
El objetivo de este trabajo es desarrollar una metodología de clasificación para la solución del problema de Máquinas de Vectores de Soporte (SVM), considerando un esquema que proporcione una solución más rápida en el contexto de datos a gran escala. En este caso, la idea de muestreo local consiste en utilizar las soluciones de varias submuestras pequeñas del conjunto de entrenamiento y enriquecer el procedimiento con observaciones de la muestra completa. A partir de ciertos criterios de búsqueda, se realiza un muestreo de mayor intensidad en las regiones donde se detecta la presencia de mayor número de vectores de soporte. Adicional a la descripción algorítmica, se plantean un par de resultados cuya finalidad es sustentar teóricamente sus propiedades. El primer resultado va en el sentido de considerar la cercanía de observaciones de una submuestra a los vectores de soporte. El segundo resultado nos permite cuantificar la aproximación de la solución basada en submuestreo respecto a la solución del problema resuelto con la totalidad de observaciones. El desempeño de este enfoque es evaluado en la práctica utilizando conjuntos de datos provenientes del sitio UCI Machine Learning Repository. Los resultados preliminares de la aplicación de nuestra metodología, muestran que se tiene una buena aproximación al error de entrenamiento con el empleo de una menor cantidad de vectores de soporte y en términos de la reducción del tiempo de ejecución, las conclusiones también son favorables.