SPANISH Description, translation to English in progress.
El aprendizaje por refuerzo es un área de la inteligencia artificial que estudia como un agente (programa, sensor, robot, etc) puede aprender de su entorno a tomar las decisiones sobre las siguientes acciones a ejecutar, basado en una función objetivo (o varias) modelada a través de un sistema de recompensas y/o penalizaciones. Permite que el agente se desenvuelva en un nuevo entorno y vaya mejorando su desempeño a medida que pasa el tiempo. En el paradigma de Internet de las cosas (IoT) podemos modificar el comportamiento de los sensores, por ejemplo, indicar cuando las luces irán a encenderse en un hogar o cada cuanto deben medirse y enviarse información ambiental que fue medida en una parcela en el campo. Muchos sistemas de telemetría actualmente requieren bastante intervención humana para ajustar su comportamiento y configuración inicial. En este proyecto proponemos el estudio de técnicas de aprendizaje por refuerzo, área de la inteligencia artificial, aplicadas a IoT para lograr aplicaciones ?autoconfigurables? en escenarios no críticos. Uno de los limitantes es la escasez de implementaciones o software libre para IoT de algoritmos de aprendizaje por refuerzo. El proyecto propone analizar escenarios de aplicación y ensayar los frameworks o librerías existentes para la construcción de un prototipo de librería de aprendizaje por refuerzo para IoT. Otro de los objetivos es estudiar y ensayar algoritmos de aprendizaje por refuerzo y proponer mejoras y adaptaciones para su uso en sensores inalámbricos en aplicaciones como edificios inteligentes y/o agricultura de precisión, permitiendo construir sistemas auto-configurables con escasa intervención humana.