Multiplicadores de Lagrange en problemas de control estocástico

Ponente(s): Omar Antonio De La Cruz Courtois
Dentro del control estocástico hay dos criterios a horizonte infinito en el que se enmarcan los problemas de control óptimo: los criterios descontados y los criterios de promedio ergódico. La presente plática trata sobre los procesos de control markoviano a tiempo discreto con restricciones en espacios Borel medibles. El criterio para optimizar estos procesos es a través de la ganancia esperada promedio y la ganancia descontada promedio sujeto a restricciones sobre un número finito de costos esperados promedios y costos descontados promedios respectivamente. Introduciremos un método para calcular políticas óptimas con restricciones para el problema promedio descontado y esperado, utilizando técnicas de multiplicadores de Lagrange que conducen a ciertas familias paramétricas de ecuaciones de optimalidad descontadas sin restricciones. Compararemos este método, con el método tradicional del cálculo multivariable para optimizar una función sujeta a restricciones. Y finalmente se mencionarán algunas aplicaciones en diversas ramas de la ingeniería donde aparece de manera natural los conceptos previamente mencionados.