Aplicación del algoritmo de aprendizaje por refuerzo Q-Learning para la generación de trayectorias óptimas en plataformas robóticas
No Thumbnail Available
Files
Date
2024-09
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Técnica de Ambato. Facultad de Ingeniería en Sistemas, Electrónica e Industrial. Carrera de Tecnologías de la Información
Abstract
Technological innovation is fundamental for business development and efficiency in Industry 4.0, which demands staying updated with the latest technologies. The rapid growth in the use of artificial intelligence (AI) offers high benefits and low operational costs, creating more stable and automated work environments. However, one of the greatest challenges in applying AI is the complexity of trajectory planning for mobile robots, as their behavior varies according to the scenario and algorithms used, making it difficult to compare learning and performance between different methods.
This research, as part of the project titled "Use of Deep Learning Techniques for Trajectory Planning of Mobile Robots within an Industrial Process," developed a trajectory planning algorithm using Q-learning and a multi-agent system that collaborate in decision-making. This algorithm employs odometry and laser sensor signals to manage states and rewards. Tests were conducted in a ROS simulation environment and replicated in a real-world scenario with the KUKA Youbot robot to implement the algorithm's actions.
The simulated environment recreates a space with obstacles, where a master agent evaluates the decisions made by the odometry agent and the laser sensor agent to autonomously make a final decision. This contributes to the comparison of AI algorithms in terms of efficiency and effectiveness within the mentioned project, laying a foundation for future improvements in trajectory planning on mobile platforms.
Description
La innovación tecnológica es fundamental para el desarrollo y eficiencia empresarial en la industria 4.0, que exige mantenerse actualizada con las últimas tecnologías. El rápido crecimiento del uso de la inteligencia artificial (IA) ofrece altos beneficios y bajos costos operacionales, creando entornos de trabajo más estables y automatizados. Sin embargo, uno de los mayores desafíos en la aplicación de la IA es la complejidad de la planificación de trayectorias para robots móviles, ya que su comportamiento varía según el escenario y los algoritmos utilizados, dificultando la comparación del aprendizaje y desempeño entre diferentes métodos.
La presente investigación, como parte del proyecto titulado 'Uso de técnicas de Deep Learning para la planificación de trayectorias de robots móviles dentro de un proceso industrial', desarrolló un algoritmo de planificación de trayectorias utilizando Q-Learning y un sistema de multi agentes que colaboran en la toma de decisiones. Este algoritmo emplea odometría y señales de un sensor láser para gestionar estados y recompensas. Se realizaron pruebas en un entorno de simulación de ROS, replicados en un escenario real con el robot KUKA Youbot para implementar las acciones del algoritmo.
El entorno simulado recrea un espacio con obstáculos, donde un agente maestro evalúa las decisiones tomadas por el agente de odometría y el agente del sensor láser para tomar una decisión final de manera autónoma. Esto contribuye a la comparación de algoritmos de IA en términos de eficiencia y efectividad dentro del proyecto mencionado, plantando una base para futuras mejoras en la planificación de trayectorias en plataformas móviles.
Keywords
INTELIGENCIA ARTIFICIAL, PLATAFORMAS MÓVILES, Q-LEARNING, INDUSTRIA 4.0, PLANIFICACIÓN DE RUTA