Please use this identifier to cite or link to this item:
http://dx.doi.org/10.25673/121502| Title: | Multi-agent reinforcement learning for deadlock handling among autonomous mobile robots |
| Author(s): | Müller, Marcel |
| Referee(s): | Zadek, Hartmut De Luca, Ernesto William |
| Granting Institution: | Otto-von-Guericke-Universität Magdeburg, Fakultät für Maschinenbau |
| Issue Date: | 2025 |
| Extent: | v, 164 Seiten |
| Type: | Hochschulschrift |
| Type: | PhDThesis |
| Exam Date: | 2025 |
| Language: | English |
| URN: | urn:nbn:de:gbv:ma9:1-1981185920-1234557 |
| Subjects: | Deadlock multi-agent reinforcement learning multi-agent pathfinding autonomous mobile robots AMR automated guided vehicles AGV proximal policy optimization PPO IMPALA fahrerlose Transportfahrzeuge FTF FTS |
| Abstract: | This dissertation explores the application of multi-agent reinforcement learning (MARL) for handling deadlocks in intralogistics systems that rely on autonomous mobile robots (AMRs). AMRs enhance operational flexibility but also increase the risk of deadlocks. Existing approaches often neglect deadlock handling in the planning phase and rely on rigid control rules that cannot adapt to dynamic operational conditions.
To address these shortcomings, this work develops a methodology for integrating MARL into logistics planning. It introduces reference models that explicitly consider deadlocks in multi-agent pathfinding (MAPF) problems. The thesis compares traditional deadlock handling strategies with MARL-based solutions, focusing on PPO and IMPALA under different training and execution modes.
Findings reveal that MARL-based strategies, particularly when combined with centralized training and decentralized execution (CTDE), outperform rule-based methods in complex, congested environments. Diese Dissertation untersucht die Anwendung von Multi-Agenten-Reinforcement-Learning (MARL) zur Behandlung von Deadlocks in Intralogistiksystemen, die auf autonomen mobilen Robotern (AMRs) basieren. AMRs erhöhen die operative Flexibilität, steigern jedoch gleichzeitig das Risiko von Deadlocks. Bestehende Ansätze vernachlässigen häufig die Deadlock-Behandlung in der Planungsphase und stützen sich auf starre Steuerungsregeln, die sich nicht an dynamische Betriebsbedingungen anpassen können. Zur Behebung dieser Schwächen wird in dieser Arbeit eine Methodik zur Integration von MARL in die Logistikplanung entwickelt. Sie führt Referenzmodelle ein, die Deadlocks in Multi-Agenten-Pfadfindungsproblemen (MAPF) explizit berücksichtigen. Die Dissertation vergleicht traditionelle Strategien zur Deadlock-Behandlung mit MARL-basierten Lösungen und konzentriert sich dabei auf PPO und IMPALA unter verschiedenen Trainings- und Ausführungsmodi. |
| Annotations: | Literaturverzeichnis: Seite 149-[165] |
| URI: | https://opendata.uni-halle.de//handle/1981185920/123455 http://dx.doi.org/10.25673/121502 |
| Open Access: | Open access publication |
| License: | (CC BY 4.0) Creative Commons Attribution 4.0 |
| Appears in Collections: | Fakultät für Maschinenbau |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Müller_Marcel_Dissertation_2025.pdf | Dissertation | 5.01 MB | Adobe PDF | ![]() View/Open |
Open access publication
