Aplicación del algoritmo de aprendizaje por refuerzo state-action-reward-state-action (SARSA) para la generación de trayectorias óptimas en plataformas robóticas
dc.contributor.advisor | Álvarez Mayorga, Edison Homero | |
dc.contributor.author | Sarzosa Villarroel, José Jeanpierre | |
dc.date.accessioned | 2024-08-19T18:01:44Z | |
dc.date.available | 2024-08-19T18:01:44Z | |
dc.date.issued | 2024-08 | |
dc.description | La planificación de trayectorias para robots móviles es clave para mejorar la eficiencia y reducir riesgos operativos dentro de la industria 4.0. Las empresas buscan implementar tecnologías avanzadas como la inteligencia artificial y el aprendizaje por refuerzo para automatizar procesos industriales. Esta investigación se desarrolló bajo la metodología Kanban, permitiendo desglosar el trabajo en varias etapas y tareas para su seguimiento y control. Se aborda la implementación del algoritmo de aprendizaje por refuerzo SARSA para generar trayectorias óptimas en plataformas robóticas móviles, centrándose en adaptar y aplicar este algoritmo "on-policy" que actualiza sus valores de acción basándose en la experiencia directa con el entorno. El proceso experimental incluyó la implementación del algoritmo SARSA en un entorno simulado para el robot con capacidades autónomas KUKA YouBot y un sensor LIDAR en un módulo Jetson AGX Orin de Nvidia. El agente interactuó con el entorno a través de episodios de entrenamiento, aprendiendo mediante la política ε-greedy de exploración y explotación de las acciones actuales y siguiente disponibles y calculadas en base a los estados actuales y siguientes, respectivamente. Los modelos entrenados se probaron en un entorno real con el robot KUKA YouBot para validar su desempeño en condiciones prácticas. Finalmente, los resultados se integraron con un proyecto más amplio que utiliza técnicas de Deep Learning para optimizar trayectorias autónomas en robots móviles dentro de procesos industriales, demostrando la viabilidad y ventajas de utilizar algoritmos de aprendizaje por refuerzo en aplicaciones robóticas avanzadas. | es_ES |
dc.description.abstract | Path planning for mobile robots is crucial to improve efficiency and reduce operational risks in the 4.0 industry. Companies are looking to implement advanced technologies such as artificial intelligence and reinforcement learning to automate industrial processes. This study was developed using the Kanban methodology, allowing the work to be broken down into several stages and tasks for monitoring and control. The implementation of the reinforcement learning algorithm SARSA to generate optimal trajectories in mobile robotic platforms is addressed, focusing on adapting and applying this "on-policy" algorithm, which updates its action values based on the direct experience with the environment. The experimental process included implementing the SARSA algorithm in a simulated environment for the autonomous-capable KUKA YouBot robot and a LIDAR sensor on an Nvidia Jetson AGX Orin module. The agent interacted with the environment through training episodes, learning through ε-greedy policy exploration and exploitation of the current and next actions available and computed based on the current and next states, respectively. The trained models were tested in a real environment with the KUKA YouBot robot to validate their performance under practical conditions. Finally, the results were integrated with a larger project using Deep Learning techniques to optimize autonomous trajectories in mobile robots within industrial processes, demonstrating the feasibility and advantages of using reinforcement learning algorithms in advanced robotic applications. | es_ES |
dc.identifier.uri | https://repositorio.uta.edu.ec/handle/123456789/42172 | |
dc.language.iso | spa | es_ES |
dc.publisher | Universidad Técnica de Ambato. Facultad de Ingeniería en Sistemas, Electrónica e Industrial. Carrera de Tecnologías de la Información | es_ES |
dc.rights | openAccess | es_ES |
dc.subject | APRENDIZAJE POR REFUERZOS | es_ES |
dc.subject | SARSA | es_ES |
dc.subject | INDUSTRIA 4.0 | es_ES |
dc.subject | KUKA | es_ES |
dc.subject | YOUBOT | es_ES |
dc.subject | PLANIFICACIÓN DE TRAYECTORIAS | es_ES |
dc.title | Aplicación del algoritmo de aprendizaje por refuerzo state-action-reward-state-action (SARSA) para la generación de trayectorias óptimas en plataformas robóticas | es_ES |
dc.type | bachelorThesis | es_ES |
Files
Original bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- t2593ti.pdf
- Size:
- 3.3 MB
- Format:
- Adobe Portable Document Format
- Description:
- Texto completo
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: