1 Archivos adjunto(s)
Nuevo enfoque para optimización de rutas dinámicas con múltiples vehículos
La logística urbana se enfrenta constantemente el desafío de gestionar entregas bajo demanda de manera eficiente, especialmente cuando las solicitudes aparecen de forma impredecible. El problema cooperativo de recogida y entrega dinámica con solicitudes estocásticas para múltiples vehículos representa uno de estos retos complejos donde los métodos tradicionales de optimización muestran limitaciones significativas en escenarios a gran escala. Esta problemática combina elementos de ruteo vehicular con optimización espaciotemporal, creando un entorno donde las decisiones deben tomarse considerando múltiples variables en constante cambio.
Arquitectura Multi-Agent Pointer Transformer
Para abordar estas limitaciones, se presenta MAPT, un marco de toma de decisiones centralizado que opera mediante secuencias de acciones. La arquitectura utiliza un codificador Transformer para procesar representaciones de todas las entidades involucradas en el sistema, incluyendo vehículos, paquetes y ubicaciones. Posteriormente, un decodificador Transformer combinado con Pointer Network genera secuencias de acciones conjuntas de manera autorregresiva, permitiendo que los vehículos coordinen sus movimientos de forma eficiente. Un módulo especializado de atención consciente de relaciones captura las complejas interacciones entre diferentes elementos del sistema, mientras que la incorporación de información previa guía el proceso de exploración hacia soluciones más prometedoras.
Ventajas comparativas y validación experimental
Las pruebas realizadas en ocho conjuntos de datos diferentes demuestran que MAPT supera significativamente a los métodos existentes tanto en rendimiento operativo como en eficiencia computacional. El enfoque logra reducir el espacio de acciones conjunto que tradicionalmente dificultaba los métodos de aprendizaje por refuerzo, al mismo tiempo que modela adecuadamente las acciones coordinadas entre vehículos. La capacidad de procesamiento del sistema permite tomar decisiones en tiempos considerablemente menores que los requeridos por métodos clásicos de investigación operativa, haciendo viable su implementación en escenarios de logística en tiempo real donde los segundos de diferencia impactan directamente en la eficiencia del servicio.
Parece que finalmente los vehículos de reparto podrían dejar de encontrarse casualmente en el mismo punto mientras el sistema central les asigna rutas contradictorias, como si estuvieran participando en una coreografía mal ensayada.