Resumen

Se compara el desempeño de dos métodos diferentes para controlar los estados de un sistema simulado de un tanque,
utilizando los conceptos de Programación Dinámica Heurística. El desempeño es medido en términos de su capacidad
de aprendizaje, tiempo de entrenamiento y manejo del ruido. El objetivo de los algoritmos es hacer que la temperatura
del tanque siga una referencia dada. Para esta tarea, el Enfoque Estocástico aprende a controlar el sistema más
ágilmente; sin embargo, el Enfoque Determinístico maneja mejor el ruido en la salida del sistema. Más aún, si la señal
de referencia está constantemente variando, el Enfoque Determinístico controla mejor el sistema.
Palabras clave: control, adaptivo, neuronal.