Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/121502
Title: Multi-agent reinforcement learning for deadlock handling among autonomous mobile robots
Author(s): Müller, Marcel
Referee(s): Zadek, Hartmut
De Luca, Ernesto William
Granting Institution: Otto-von-Guericke-Universität Magdeburg, Fakultät für Maschinenbau
Issue Date: 2025
Extent: v, 164 Seiten
Type: HochschulschriftLook up in the Integrated Authority File of the German National Library
Type: PhDThesis
Exam Date: 2025
Language: English
URN: urn:nbn:de:gbv:ma9:1-1981185920-1234557
Subjects: Deadlock
multi-agent reinforcement learning
multi-agent pathfinding
autonomous mobile robots
AMR
automated guided vehicles
AGV
proximal policy optimization
PPO
IMPALA
fahrerlose Transportfahrzeuge
FTF
FTS
Abstract: This dissertation explores the application of multi-agent reinforcement learning (MARL) for handling deadlocks in intralogistics systems that rely on autonomous mobile robots (AMRs). AMRs enhance operational flexibility but also increase the risk of deadlocks. Existing approaches often neglect deadlock handling in the planning phase and rely on rigid control rules that cannot adapt to dynamic operational conditions. To address these shortcomings, this work develops a methodology for integrating MARL into logistics planning. It introduces reference models that explicitly consider deadlocks in multi-agent pathfinding (MAPF) problems. The thesis compares traditional deadlock handling strategies with MARL-based solutions, focusing on PPO and IMPALA under different training and execution modes. Findings reveal that MARL-based strategies, particularly when combined with centralized training and decentralized execution (CTDE), outperform rule-based methods in complex, congested environments.
Diese Dissertation untersucht die Anwendung von Multi-Agenten-Reinforcement-Learning (MARL) zur Behandlung von Deadlocks in Intralogistiksystemen, die auf autonomen mobilen Robotern (AMRs) basieren. AMRs erhöhen die operative Flexibilität, steigern jedoch gleichzeitig das Risiko von Deadlocks. Bestehende Ansätze vernachlässigen häufig die Deadlock-Behandlung in der Planungsphase und stützen sich auf starre Steuerungsregeln, die sich nicht an dynamische Betriebsbedingungen anpassen können. Zur Behebung dieser Schwächen wird in dieser Arbeit eine Methodik zur Integration von MARL in die Logistikplanung entwickelt. Sie führt Referenzmodelle ein, die Deadlocks in Multi-Agenten-Pfadfindungsproblemen (MAPF) explizit berücksichtigen. Die Dissertation vergleicht traditionelle Strategien zur Deadlock-Behandlung mit MARL-basierten Lösungen und konzentriert sich dabei auf PPO und IMPALA unter verschiedenen Trainings- und Ausführungsmodi.
Annotations: Literaturverzeichnis: Seite 149-[165]
URI: https://opendata.uni-halle.de//handle/1981185920/123455
http://dx.doi.org/10.25673/121502
Open Access: Open access publication
License: (CC BY 4.0) Creative Commons Attribution 4.0(CC BY 4.0) Creative Commons Attribution 4.0
Appears in Collections:Fakultät für Maschinenbau

Files in This Item:
File Description SizeFormat 
Müller_Marcel_Dissertation_2025.pdfDissertation5.01 MBAdobe PDFThumbnail
View/Open