Aplicación del algoritmo de aprendizaje por refuerzo state-action-reward-state-action (SARSA) para la generación de trayectorias óptimas en plataformas robóticas

dc.contributor.advisorÁlvarez Mayorga, Edison Homero
dc.contributor.authorSarzosa Villarroel, José Jeanpierre
dc.date.accessioned2024-08-19T18:01:44Z
dc.date.available2024-08-19T18:01:44Z
dc.date.issued2024-08
dc.descriptionLa planificación de trayectorias para robots móviles es clave para mejorar la eficiencia y reducir riesgos operativos dentro de la industria 4.0. Las empresas buscan implementar tecnologías avanzadas como la inteligencia artificial y el aprendizaje por refuerzo para automatizar procesos industriales. Esta investigación se desarrolló bajo la metodología Kanban, permitiendo desglosar el trabajo en varias etapas y tareas para su seguimiento y control. Se aborda la implementación del algoritmo de aprendizaje por refuerzo SARSA para generar trayectorias óptimas en plataformas robóticas móviles, centrándose en adaptar y aplicar este algoritmo "on-policy" que actualiza sus valores de acción basándose en la experiencia directa con el entorno. El proceso experimental incluyó la implementación del algoritmo SARSA en un entorno simulado para el robot con capacidades autónomas KUKA YouBot y un sensor LIDAR en un módulo Jetson AGX Orin de Nvidia. El agente interactuó con el entorno a través de episodios de entrenamiento, aprendiendo mediante la política ε-greedy de exploración y explotación de las acciones actuales y siguiente disponibles y calculadas en base a los estados actuales y siguientes, respectivamente. Los modelos entrenados se probaron en un entorno real con el robot KUKA YouBot para validar su desempeño en condiciones prácticas. Finalmente, los resultados se integraron con un proyecto más amplio que utiliza técnicas de Deep Learning para optimizar trayectorias autónomas en robots móviles dentro de procesos industriales, demostrando la viabilidad y ventajas de utilizar algoritmos de aprendizaje por refuerzo en aplicaciones robóticas avanzadas.es_ES
dc.description.abstractPath planning for mobile robots is crucial to improve efficiency and reduce operational risks in the 4.0 industry. Companies are looking to implement advanced technologies such as artificial intelligence and reinforcement learning to automate industrial processes. This study was developed using the Kanban methodology, allowing the work to be broken down into several stages and tasks for monitoring and control. The implementation of the reinforcement learning algorithm SARSA to generate optimal trajectories in mobile robotic platforms is addressed, focusing on adapting and applying this "on-policy" algorithm, which updates its action values based on the direct experience with the environment. The experimental process included implementing the SARSA algorithm in a simulated environment for the autonomous-capable KUKA YouBot robot and a LIDAR sensor on an Nvidia Jetson AGX Orin module. The agent interacted with the environment through training episodes, learning through ε-greedy policy exploration and exploitation of the current and next actions available and computed based on the current and next states, respectively. The trained models were tested in a real environment with the KUKA YouBot robot to validate their performance under practical conditions. Finally, the results were integrated with a larger project using Deep Learning techniques to optimize autonomous trajectories in mobile robots within industrial processes, demonstrating the feasibility and advantages of using reinforcement learning algorithms in advanced robotic applications.es_ES
dc.identifier.urihttps://repositorio.uta.edu.ec/handle/123456789/42172
dc.language.isospaes_ES
dc.publisherUniversidad Técnica de Ambato. Facultad de Ingeniería en Sistemas, Electrónica e Industrial. Carrera de Tecnologías de la Informaciónes_ES
dc.rightsopenAccesses_ES
dc.subjectAPRENDIZAJE POR REFUERZOSes_ES
dc.subjectSARSAes_ES
dc.subjectINDUSTRIA 4.0es_ES
dc.subjectKUKAes_ES
dc.subjectYOUBOTes_ES
dc.subjectPLANIFICACIÓN DE TRAYECTORIASes_ES
dc.titleAplicación del algoritmo de aprendizaje por refuerzo state-action-reward-state-action (SARSA) para la generación de trayectorias óptimas en plataformas robóticases_ES
dc.typebachelorThesises_ES

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
t2593ti.pdf
Size:
3.3 MB
Format:
Adobe Portable Document Format
Description:
Texto completo

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: