Control minimax de sistemas estocásticos a tiempo discreto con criterio de costo descontado

Autor: Luz Esmeralda Almada Valenzuela
Analizar sistemas de control minimax a tiempo discreto, los cuales consisten en lo siguiente. En contraste con los problemas de control óptimo estándar, en los que solo hay un único responsable de tomar las decisiones, en los problemas de control minimax existen dos tomadores de decisiones, el controlador mismo y un “oponente”. Su evolución en el tiempo se puede describir de la siguiente manera. Al tiempo t, cuando el estado del sistema es "x" , el controlador elige una acción "a" y el oponente elige una acción "b". Entonces, el controlador paga un costo c(x,a,b) al oponente, y el sistema se mueve a un nuevo estado de acuerdo a una probabilidad de transición. Una vez que el sistema se encuentra en el nuevo estado el proceso se repite una y otra vez. Los costos se acumulan de acuerdo a un funcional de costo total considerando horizonte, ya sea, finito o infinito. Por lo tanto el objetivo del controlador es minimizar el máximo costo generado por el oponente. Específicamente, se abordan sistemas de control minimax considerando el índice de costo descontado con horizonte finito e infinito. Además supondremos que el espacio de acciones del controlador es numerable y el del oponente de Borel. Más aún, consideraremos que el costo es posiblemente no acotado, lo cual se analizará en el contexto de normas ponderadas. Una de las aplicaciones más importantes de los sistemas de control minimax, la cual abordaremos es en sistemas de control que dependen de parámetros desconocidos. A este tipo de sistemas se le conoce como “juegos contra la naturaleza” ya que al oponente se le puede considerar como la naturaleza, la cual elige en cada etapa el parámetro desconocido.