Enlace al PROYECTO presentado
El aprendizaje por refuerzo es un área de la inteligencia artificial que estudia como un agente (programa, sensor, robot, etc) puede aprender de su entorno a tomar las decisiones sobre las siguientes acciones a ejecutar, basado en una función objetivo (o varias) modelada a través de un sistema de recompensas y/o penalizaciones. Permite que el agente se desenvuelva en un nuevo entorno y vaya mejorando su desempeño a medida que pasa el tiempo.