Was ist ein Multi-Agent-System?
Ein Multi-Agent-System, kurz MAS, besteht aus mehreren autonomen Agenten, die sich eine Umgebung teilen und darin zusammenarbeiten, sich abstimmen oder auch konkurrieren. Statt einer zentralen Instanz, die alles entscheidet, verteilt sich die Kontrolle auf spezialisierte Agenten. Jeder verantwortet einen Teil des Problems und kommuniziert mit den anderen.
Der Reiz liegt in dieser Arbeitsteilung. Aufgaben, die für ein einzelnes Programm zu groß oder zu vielschichtig wären, lassen sich auf ein eingespieltes Team verteilen. Der Preis dafür ist Komplexität: Ohne robuste Kommunikations- und Koordinationsregeln wird aus dem Team schnell ein Chaos.
- Mehrere autonome Agenten in einer gemeinsamen Umgebung
- Verteilte Kontrolle und spezialisierte Rollen statt zentraler Steuerung
- Stärken: Flexibilität, Robustheit, Skalierbarkeit
- Preis: anspruchsvolleres Design mit echten Kommunikationsregeln
Multi-Agent oder Single-Agent: Wann sich der Aufwand lohnt
Nicht jede Aufgabe braucht ein Team. Ein Single-Agent arbeitet isoliert mit einer zentralen Entscheidungslogik, eine Schach-KI ist das klassische Bild. Für viele Anwendungen reicht ein einzelner Agent mit den passenden Werkzeugen vollkommen aus, und er ist leichter zu bauen, zu testen und zu überwachen.
Mehrere Agenten lohnen sich, wenn eine Aufgabe sich klar in Rollen zerlegen lässt, parallel laufen kann oder mehrere getrennte Systeme und Datenquellen berührt. Aus meiner Projekterfahrung gilt: Fangen Sie nicht mit einem Multi-Agent-System an, weil es modern klingt. Die Komplexität sollte die Aufgabe erzwingen, nicht der Trend.
- Single-Agent: ein Modell plus Werkzeuge, für die meisten Fälle genug
- MAS: klar trennbare Rollen, Parallelität, mehrere Systeme im Spiel
- Mehr Agenten bedeuten mehr Fehlerquellen und mehr Aufwand
- Die Aufgabe entscheidet, nicht der Trend
Die Topologien: Supervisor, Netzwerk, Hierarchie, adaptiv
Wie die Agenten zueinander stehen, bestimmt die Topologie. Zentralisiert heißt: ein Supervisor oder Hub delegiert an Worker-Agenten und führt deren Ergebnisse zusammen. Dezentral heißt: Die Agenten reden als gleichberechtigte Peers direkt miteinander, ohne zentrale Instanz. Hierarchisch ordnet sie in Ebenen, mit einem Meta-Agenten über mehreren Sub-Agenten.
Moderne Systeme gehen weiter: Bei dynamisch-adaptiven Ansätzen steht die Topologie nicht zur Entwurfszeit fest, sondern entwickelt sich zur Laufzeit. Ein übergeordneter Mechanismus beobachtet den Fortschritt, erzeugt Agenten bei Bedarf und verteilt Rollen neu. Mein Rat: Starten Sie mit einem Supervisor und führen Sie mehr Dynamik erst ein, wenn Sie sie auch beobachten können.
- Zentralisiert: Supervisor/Hub-and-Spoke delegiert und bündelt
- Dezentral: Peer-to-Peer-Netzwerk ohne zentrale Instanz
- Hierarchisch: Meta-Agent über mehreren Ebenen von Sub-Agenten
- Dynamisch-adaptiv: Topologie entsteht zur Laufzeit, nur mit Observability
Wie ein Agent denkt: das BDI-Modell
Um ein Team zu verstehen, hilft ein Blick auf den einzelnen Agenten. Eine klassische Architektur dafür ist das BDI-Modell von Michael Bratman. Es teilt den inneren Zustand eines Agenten in drei Größen: Beliefs sind seine Überzeugungen über die Welt, auch über die anderen Agenten. Desires sind seine Ziele. Intentions sind die Pläne, auf die er sich festgelegt hat und die er gerade ausführt.
Der Kerngedanke ist die Trennung von Auswahl und Ausführung. Der Agent entscheidet, welchen Plan er verfolgt, und führt ihn dann konsequent aus, statt bei jedem Schritt alles neu zu überdenken. Das macht sein Verhalten nachvollziehbar, ein Vorteil, der bei der Fehlersuche in einem Team aus vielen Agenten Gold wert ist.
- Beliefs: das Weltwissen des Agenten, kann unvollständig oder falsch sein
- Desires und Goals: was der Agent erreichen will
- Intentions und Plans: worauf er sich festgelegt hat und ausführt
- Trennt Plan-Auswahl von Plan-Ausführung, nachvollziehbares Verhalten
Wie Agenten reden: von FIPA-ACL zu MCP und A2A
Ein Team funktioniert nur mit einer gemeinsamen Sprache. Die klassische Antwort heißt FIPA-ACL und KQML, Agenten-Kommunikationssprachen auf Basis der Sprechakttheorie. Nachrichten tragen ein Performativ wie INFORM, REQUEST oder PROPOSE und folgen festen Protokollen. Diese Welt ist erprobt, etwa in Java mit JADE.
Für KI-Agenten auf Basis großer Sprachmodelle haben sich zwei neuere Standards etabliert. Das Model Context Protocol, kurz MCP, verbindet einen Agenten mit Werkzeugen und Datenquellen. A2A, Agent-to-Agent, regelt die direkte Zusammenarbeit zwischen Agenten. Eine einfache Merkregel: MCP spricht Agent-an-Werkzeug, A2A spricht Agent-an-Agent.
- Klassisch: FIPA-ACL und KQML mit Performativen wie INFORM, REQUEST, PROPOSE
- Modern: MCP verbindet Agenten mit Werkzeugen und Daten
- Modern: A2A regelt die direkte Zusammenarbeit zwischen Agenten
- Merkregel: MCP = Agent-an-Werkzeug, A2A = Agent-an-Agent
Koordination: Aufgaben verteilen ohne Chaos
Wer macht was? Diese Frage beantworten Koordinationsmechanismen. Ein Klassiker ist das Contract Net Protocol: Ein Manager schreibt eine Aufgabe aus, mehrere Agenten geben ein Angebot ab, und der Manager vergibt sie wie bei einer Ausschreibung. Daneben stehen Auktionsmodelle und Konsens-Verfahren.
Bei Agenten auf LLM-Basis kommt ein subtileres Problem dazu. Jeder Agent arbeitet in seinem eigenen Kontext und kann dasselbe Ziel anders interpretieren als seine Kollegen. Diese Semantic Intent Divergence ist eine Hauptursache für stille Fehler. Neuere Ansätze wie ein Semantic-Consensus-Framework versuchen genau das früh zu erkennen und aufzulösen, mit gemeinsamem Prozesskontext, Konflikterkennung und einem Drift-Monitor.
- Contract Net Protocol: Aufgaben per Ausschreibung und Angebot vergeben
- Auktionen und Konsens als weitere Verteilmechanismen
- Risiko: Agenten interpretieren dasselbe Ziel unterschiedlich
- Gegenmittel: gemeinsamer Prozesskontext, Konflikterkennung, Drift-Monitor
Frameworks: LangGraph, CrewAI, AutoGen, MetaGPT
Man muss diese Mechanismen nicht von Hand bauen. Vier Frameworks prägen die Praxis, jedes mit eigener Philosophie. LangGraph modelliert das System als Graphen und Zustandsmaschine und gibt deterministische, gut auditierbare Kontrolle. CrewAI setzt auf rollenbasiertes Teamplay. AutoGen koordiniert die Agenten über eine Konversation. MetaGPT bildet standardisierte Arbeitsprozesse ab, in denen Agenten strukturierte Dokumente weiterreichen wie in einer Firma.
Es gibt kein pauschal bestes Framework. Die Wahl hängt davon ab, wie viel Kontrolle Sie brauchen und wie Ihr Team denkt. Die Forschung experimentiert zudem mit gelernten Topologien wie DyLAN und GPTSwarm, die die Zusammenarbeit automatisch optimieren.
- LangGraph: Graphen und Zustandsmaschine, deterministische Kontrolle
- CrewAI: rollenbasiertes Team aus Agenten
- AutoGen: konversationsgesteuerte Koordination
- MetaGPT: standardisierte Prozesse über Dokumentenaustausch
Wo Multi-Agent-Systeme glänzen
Multi-Agent-Systeme sind keine Theorie. Im Smartgrid steuern sie Energieflüsse und ermöglichen Peer-to-Peer-Handel zwischen Erzeugern und Verbrauchern. In der Robotik koordinieren sie Schwärme und Multi-Robot-Teams. In der Softwareentwicklung teilen sich Agenten Planung, Code und Review. Auch im automatisierten Handel und in mehrstufigen Geschäftsprozessen wie langen Kundenservice-Ketten spielen sie ihre Stärken aus.
Gemeinsam ist diesen Feldern, dass eine Aufgabe sich natürlich in Teilprobleme zerlegt, die parallel und teils widersprüchlich bearbeitet werden. Genau dort schlägt ein Team aus Agenten einen einzelnen, überladenen Agenten.
- Smartgrid: Energiemanagement und Peer-to-Peer-Handel
- Robotik: Schwarmverhalten und Multi-Robot-Teams
- Softwareentwicklung und automatisierter Handel
- Mehrstufige Geschäftsprozesse wie Kundenservice-Ketten
Die größten Stolpersteine
So viel Potenzial, so viele Fallstricke. Mehrere Agenten lernen und handeln gleichzeitig, wodurch sich die Umgebung ständig verändert, ein bewegliches Ziel, das man Nichtstationarität nennt. Mit jeder zusätzlichen Agenten-Stimme wächst die Komplexität. Und es entstehen neue Sicherheitsfragen, etwa Prompt-Injection über Agentengrenzen hinweg oder eine schleichende Ausweitung von Rechten.
Studien zu Unternehmens-Einsätzen zeichnen ein ernüchterndes Bild: Ein großer Teil der Projekte scheitert, und der Löwenanteil dieser Fehler kommt laut Auswertungen nicht aus schwachen Modellen, sondern aus Spezifikation und Koordination. Mein Rat: Beobachtbarkeit und Konsens-Mechanismen sind kein Nachgedanke. Und mehr Agenten heißt mehr Datenflüsse, was DSGVO-Datenminimierung und die KI-Kennzeichnungspflicht des EU AI Act direkt berührt.
- Nichtstationarität: alle Agenten verändern die Umgebung gleichzeitig
- Komplexität und Kosten steigen mit jeder Agenten-Stimme
- Sicherheit: Prompt-Injection über Grenzen, Rechte-Ausweitung
- Governance: mehr Datenflüsse berühren DSGVO und EU AI Act Art. 50
Fünf Beiträge, die tiefer gehen
Dieser Leitfaden bündelt fünf vertiefende Artikel: von der Grundsatzentscheidung Single- gegen Multi-Agent über Topologien, Kommunikation und Frameworks bis zu den Gründen, warum Projekte scheitern. Jeder Beitrag steht für sich und enthält konkrete Beispiele.
Wenn Sie überlegen, ob ein Multi-Agent-System Ihr Problem wirklich löst, oder ein bestehendes Setup stabiler machen wollen, sprechen wir darüber.
- Single- oder Multi-Agent: wann sich mehrere Agenten lohnen
- Topologien: Supervisor, Netzwerk, Hierarchie, adaptiv
- Kommunikation: von FIPA-ACL zu MCP und A2A
- Frameworks im Vergleich: LangGraph, CrewAI, AutoGen, MetaGPT
- Warum Multi-Agent-Systeme scheitern und wie man es verhindert





