Wie ich wirklich mit KI arbeite: Agenten-Architektur

Wenn ich Unternehmern erzähle, dass ich KI als orchestriertes Team aus spezialisierten Agenten mit eigenem Gedächtnis betreibe statt als Chat-Fenster, ernte ich meist zwei Reaktionen: Neugier und Skepsis. Beide sind berechtigt. Das meiste, was als „KI-Agent" verkauft wird, ist Marketing. Und der Abstand zwischen „ChatGPT benutzen" und „ein KI-System betreiben" ist groß. Er ist aber lernbar.

Dieser Artikel zeigt die Architektur, mit der ich seit über einem Jahr täglich arbeite. Bewusst auf der Ebene von Prinzipien und Funktionen, ohne konkrete Produktnamen: Die Werkzeuge ändern sich alle paar Monate, die Bauidee bleibt. Wer die Prinzipien versteht, baut sein eigenes Setup mit den Werkzeugen seiner Wahl.

Ein Hinweis vorweg, der das Ganze ehrlich macht: Dieser Text ist selbst mit genau diesem System entstanden. Mehrere Agenten haben recherchiert, gegengeprüft, geschrieben und veröffentlicht, jeweils unter meiner Freigabe. Sie lesen also kein theoretisches Konzept. Sie lesen die Beschreibung eines Werkzeugs, das in diesem Moment in Gebrauch ist.

Das Grundprinzip: ein Orchestrator, viele Spezialisten

Der wichtigste Unterschied zur üblichen KI-Nutzung: Ich rede mit einem Orchestrator. Das ist ein leistungsstarker Agent, dessen Hauptaufgabe im Delegieren liegt. Er zerlegt eine Aufgabe, verteilt die Teile an spezialisierte Sub-Agenten, prüft deren Ergebnisse und führt sie zusammen.

Ein Orchestrator zerlegt, delegiert, prüft und synthetisiert. Spezialisten arbeiten parallel, verbunden über einen einheitlichen Standard.

Ein einzelner Agent, der alles selbst macht, stößt schnell an Grenzen: begrenzte Aufmerksamkeit, vermischte Kontexte, keine Parallelität. Ein Orchestrator-Modell lässt dagegen zehn Spezialisten gleichzeitig arbeiten. Einer recherchiert, einer verifiziert, einer setzt um, einer denkt dagegen. Der Orchestrator behält den Überblick, wie ein Manager, der die richtigen Leute mit den richtigen Aufgaben betraut und am Ende verantwortet.

Jeder Sub-Agent arbeitet in seinem eigenen, sauberen Arbeitsbereich. Der Vorteil wird unterschätzt: Die Recherche-Tiefe eines Spezialisten verschmutzt den Hauptkontext nie. Der Orchestrator bekommt das verdichtete Ergebnis, die Schlussfolgerung statt der 500 gelesenen Zeilen. So bleibt das System auch bei großen Aufgaben klar.

Modell-Diversität: warum nicht alles dasselbe Modell macht

Ein Detail hebt die Qualität spürbar: Meine Agenten laufen auf verschiedenen KI-Modellen. Der Orchestrator nutzt ein anderes Modell als der Sparringspartner, der seine Vorschläge kritisch hinterfragt. Zwei Instanzen desselben Modells teilen dieselben blinden Flecken. Eine echte zweite Meinung braucht eine andere „Denkschule".

In der Praxis heißt das: Bei einer wichtigen Entscheidung lasse ich ein unabhängiges Modell aus einem anderen Haus gezielt dagegenhalten, mit dem Auftrag, die stärksten Gegenargumente zu finden. Das fängt Denkfehler, die ein einzelnes Modell oder ein einzelner Mensch übersieht. Wie dieser Gegencheck genau abläuft, beschreibe ich in einem eigenen Teil dieser Serie.

Das Gedächtnis: warum persistenter Kontext alles verändert

Die größte Schwäche von Standard-KI ist das fehlende Gedächtnis: Jedes Gespräch beginnt bei null. Mein System hat ein persistentes, mehrschichtiges Gedächtnis. Es weiß, wer ich bin, wie ich arbeite, woran ich gerade arbeite und was vergangene Entscheidungen waren.

Drei Gedächtnis-Ebenen plus externe Schichten: Identität immer geladen, Index als Überblick, Tiefenspeicher bei Bedarf.

Die Architektur folgt einem einfachen Prinzip aus der Informatik: Was immer gebraucht wird, liegt schnell zugänglich oben. Was seltener gebraucht wird, liegt darunter und wird bei Bedarf geholt. Ganz oben stehen meine Identität und Arbeitsweise, immer präsent. Darunter ein Index dessen, was aktuell relevant ist. Darunter der volle Detailspeicher, geladen nur bei konkretem Bedarf.

Externe Schichten ergänzen das für Aufgaben, die einfacher Text schlecht kann: ein Wissens-Graph für vernetzte Zusammenhänge, ein Verlaufsspeicher für zeitliche Episoden, und ein abgesicherter Tresor für alles Sensible. Der Tresor gehört strikt getrennt und niemals in den normalen Textspeicher. Diese Trennung ist Sicherheits-Pflicht.

Der Effekt im Alltag: Ich erkläre meinem System nie, wer ich bin und was ich vorhabe. Es weiß es. Der Kontext, den die meisten Menschen mühsam in jeden Prompt tippen, ist hier dauerhaft hinterlegt und gepflegt. Den Aufbau dieses Gedächtnisses beschreibe ich im Detail in Teil 1 der Serie, und warum Kontext der unterschätzteste Qualitätshebel ist, steht hier.

Die Verbindung zur Welt: ein Standard statt hundert Einzel-Brücken

Ein KI-Agent, der nur reden kann, bleibt begrenzt. Meiner greift auf Datenquellen, Werkzeuge und Systeme zu, über einen einheitlichen Verbindungs-Standard statt über hundert einzeln programmierte Schnittstellen. Das Prinzip kennen Sie vom Universal-Stecker: einmal den Standard implementieren, dann lässt sich jedes kompatible System anschließen.

Dieser Standard ist der Grund, warum mein System Dinge tut statt nur Texte zu schreiben: Daten abrufen, Recherchen durchführen, Inhalte veröffentlichen, Systeme abfragen. Eine Regel dabei ist unverhandelbar: Zugriffe folgen dem Prinzip der minimalen Rechte, und alles Verändernde oder Riskante braucht meine ausdrückliche Freigabe. Das technische Prinzip dahinter erkläre ich im Artikel über Verbindungs-Standards für KI.

Wiederverwendbare Abläufe: einmal definieren, immer nutzen

Wiederkehrende Aufgaben löse ich über kodifizierte Abläufe, gespeicherte Arbeitsanweisungen für bestimmte Aufgabentypen, statt jedes Mal neu. Ein Ablauf für „Entscheidung strukturiert abwägen", einer für „Inhalt faktensicher veröffentlichen", einer für „Recherche mit Gegenprüfung". Einmal sauber definiert, liefern sie konsistente Qualität, ohne dass ich die Methodik jedes Mal neu beschreibe.

Hier liegt der Übergang von „KI gelegentlich nutzen" zu „mit KI produktiv arbeiten". Der Wert steckt in der Sammlung bewährter, wiederholbarer Abläufe, wie in der Bibliothek von Standardverfahren eines gut geführten Unternehmens. Der einzelne clevere Prompt ist dagegen fast wertlos.

Der Lebenszyklus einer Aufgabe, mit zwei festen Kontrollpunkten

So sieht eine typische Aufgabe von Anfang bis Ende aus:

Der Lebenszyklus einer Aufgabe: Der Mensch steht am Anfang (Auftrag) und vor der Schaltung (Freigabe). Nichts geht ungeprüft live.

Zwei Punkte sind mir dabei heilig. Erstens der Faktencheck: Bevor irgendetwas mit harten Behauptungen veröffentlicht wird, Zahlen, Gesetze, Daten, prüfen mehrere unabhängige Agenten die Aussagen gegen Originalquellen. Aus eigener Erfahrung weiß ich, wie wichtig das ist. Ein einzelnes Modell produziert gelegentlich plausibel klingende, aber falsche Fakten. Mehrere parallele Prüfer gegen echte Quellen fangen das ab, bevor es Schaden anrichtet. Was passiert, wenn dieses Gate zuschlägt, habe ich hier offen beschrieben.

Zweitens der Mensch im Steuerkreis: Das System arbeitet weitgehend selbständig, schaltet aber nichts ungeprüft scharf. Am Anfang steht mein Auftrag, vor jeder Veröffentlichung oder riskanten Aktion meine Freigabe. Die KI macht die Arbeit, ich treffe die Entscheidung und trage die Verantwortung. Das ist bewusste Architektur, kein Übergangszustand: Bei allem, was nach außen wirkt oder Konsequenzen hat, bleibt der Mensch der Schaltpunkt.

Was das in der Praxis bedeutet

Der Unterschied zeigt sich bei komplexen, mehrstufigen Vorhaben, kaum bei der einzelnen Frage. Ein Beispiel aus der jüngeren Vergangenheit: der Aufbau eines umfangreichen Wissens-Archivs mit Dutzenden faktensicheren Fachartikeln. Ein Mensch allein bräuchte dafür Wochen. Ein einzelnes KI-Modell würde an Konsistenz und Faktentreue scheitern. Das orchestrierte System recherchiert parallel, schreibt im konsistenten Stil, prüft jeden harten Fakt gegen Quellen und veröffentlicht erst nach meiner Freigabe. Es braucht einen Bruchteil der Zeit und liefert höhere Verlässlichkeit als jede der beiden Alternativen allein.

Und ja: Als bei genau diesem Aufbau ein Faktenfehler durch die erste Schreibrunde rutschte, eine erfundene Detailangabe, fing ihn exakt der mehrstufige Prüf-Mechanismus vor der Veröffentlichung. Das System ist fehlbar. Es ist so gebaut, dass seine Fehler aufgefangen werden, bevor sie nach außen gelangen. Darauf kommt es an.

Die Prinzipien, die Sie übernehmen können

Sie brauchen mein konkretes Setup nicht, die Werkzeuge sind austauschbar. Übertragbar sind die Prinzipien:

Orchestrieren statt alles selbst tun. Ein führender Agent, der delegiert, schlägt einen einzelnen Alleskönner, wie in einer Organisation.
Perspektiven-Vielfalt einbauen. Eine zweite, unabhängige Modell-Sicht fängt blinde Flecken. Lassen Sie KI gegen KI antreten, bevor Sie wichtige Entscheidungen treffen.
Kontext persistent machen. Hinterlegen Sie einmal, wer Sie sind und wie Sie arbeiten, statt es in jeden Prompt zu tippen. Der größte Qualitätssprung mit dem geringsten Aufwand.
Harte Fakten gegenprüfen. Übernehmen Sie Zahlen, Gesetze oder Daten nie ungeprüft aus einem Modell. Gegen Originalquellen verifizieren, idealerweise mehrfach.
Den Menschen am Schaltpunkt lassen. Automatisieren Sie die Arbeit, behalten Sie die Verantwortung. Vor allem, was nach außen wirkt, gehört eine menschliche Freigabe.

Die ehrlichen Grenzen

Damit dieser Artikel kein Hochglanz-Prospekt wird: Ein solches System zu bauen und zu pflegen ist Arbeit. Für gelegentliche Einzelfragen lohnt es sich nicht, da reicht ein normales KI-Werkzeug. Es lohnt sich für regelmäßige, komplexe, mehrstufige Aufgaben, wenn man bereit ist, Zeit in Architektur und Pflege zu investieren. Und es ersetzt kein Fachwissen. Das System verstärkt mein Urteil. Wer ohne eigenes Verständnis blind delegiert, bekommt schnelle, aber ungeprüfte Ergebnisse.

Genau deshalb teile ich die Architektur offen. Den Unterschied macht das Verständnis, wie man die Teile richtig zusammensetzt und wo der Mensch unverzichtbar bleibt. Wer das versteht, nutzt KI als Verstärker für Menschen, die wissen, was sie tun.

Wie ich wirklich mit KI arbeite: Die Architektur hinter einem persönlichen Agenten-System