El aprendizaje por refuerzo es un área de la inteligencia artificial que estudia como un agente (programa, sensor, robot, etc) puede aprender de su entorno a tomar las decisiones sobre las siguientes acciones a ejecutar, basado en una función objetivo (o varias) modelada a través de un sistema de recompensas y/o penalizaciones. Permite que el agente se desenvuelva en un nuevo entorno y vaya mejorando su desempeño a medida que pasa el tiempo. En el paradigma de Internet de las cosas (IoT) podemos modificar el comportamiento de los sensores, por ejemplo, indicar cuando las luces irán a encenderse en un hogar o cada cuanto deben medirse y enviarse información ambiental que fue medida en una parcela en el campo. Muchos sistemas de telemetría actualmente requieren bastante intervención humana para ajustar su comportamiento y configuración inicial. En este proyecto proponemos el estudio de técnicas de aprendizaje por refuerzo, área de la inteligencia artificial, aplicadas a IoT para lograr aplicaciones ?autoconfigurables? en escenarios no críticos. Uno de los limitantes es la escasez de implementaciones o software libre para IoT de algoritmos de aprendizaje por refuerzo. El proyecto propone analizar escenarios de aplicación y ensayar los frameworks o librerías existentes para la construcción de un prototipo de librería de aprendizaje por refuerzo para IoT. Otro de los objetivos es estudiar y ensayar algoritmos de aprendizaje por refuerzo y proponer mejoras y adaptaciones para su uso en sensores inalámbricos en aplicaciones como edificios inteligentes y/o agricultura de precisión, permitiendo construir sistemas auto-configurables con escasa intervención humana.