Was ist Loop Engineering?

Loop Engineering ist gerade das Modewort der AI-Szene. Ein einziger Post dazu erreichte 6,5 Millionen Aufrufe auf X. Hinter dem Hype steckt eine echte Verschiebung in der Art, wie Menschen mit AI-Agenten arbeiten.

Die Idee ist einfach: Statt jeden Prompt von Hand einzugeben, baut man einen Kreislauf. Der Agent führt eine Aufgabe aus, bekommt Feedback, korrigiert sich und wiederholt den Schritt, bis das Ziel erreicht ist. Der Mensch schreibt nicht mehr den einzelnen Prompt. Er baut die Schleife, die den Agenten immer wieder neu anstösst.

Der Begriff ist neu. Er tauchte Anfang 2026 auf, als führende Köpfe der Szene begannen, ihre Arbeitsweise zu beschreiben.

Boris Cherny, Leiter von Claude Code bei Anthropic, brachte es auf den Punkt: «Ich prompte Claude nicht mehr. Ich habe Loops, die laufen. Sie prompten Claude und entscheiden, was zu tun ist. Meine Aufgabe ist es, Loops zu schreiben.»

Peter Steinberger, Schöpfer von OpenClaw und jetzt bei OpenAI, formulierte die These: «Sie sollten keine Coding-Agenten mehr prompten. Sie sollten Loops designen, die Ihre Agenten prompten.»

Andrej Karpathy, ehemals Tesla AI und OpenAI, nennt diese Zeit die «Loopy Era of AI».

So weit die grossen Worte. Schauen wir uns an, was das konkret bedeutet.

Ein einfaches Beispiel zum Einstieg

Ein Entwickler hinterlässt am Freitagabend eine Notiz: 30 Tests in der Codebase schlagen fehl, die Ursachen sind bekannt und dokumentiert. Früher hätte er das am Montag selbst abgearbeitet, Test für Test.

Mit einem Loop läuft das anders. Er beschreibt das Ziel einmal: «Bringe alle Tests zum Laufen, ändere keine Test-Logik, sondern den Code dahinter.» Dann startet er die Schleife. Der Agent nimmt sich den ersten fehlschlagenden Test, ändert den Code, lässt die Tests laufen, schaut auf das Ergebnis. Grün? Weiter zum nächsten. Rot? Andere Lösung versuchen. Das wiederholt sich, bis alle Tests grün sind oder der Agent an einem Punkt nicht weiterkommt und eine Frage hinterlässt.

Am Montag findet der Entwickler 27 reparierte Tests und drei markierte Fälle, bei denen ein Mensch entscheiden muss. Er hat keinen einzigen Prompt getippt. Er hat eine Schleife gebaut, die das für ihn erledigt hat.

Das ist der Kern von Loop Engineering: nicht der einzelne clevere Prompt, sondern der Kreislauf, der sich selbst korrigiert.

Wie funktioniert ein Agent Loop?

Ein Agent Loop folgt dem gleichen Muster, das gute Entwickler täglich anwenden:

Aktion ausführen – Code schreiben, Datei ändern, Recherche durchführen
Feedback bekommen – Tests laufen lassen, CI prüfen, Ergebnis validieren
Korrigieren – Bei Fehlern anpassen, bei Erfolg weitermachen
Wiederholen – Bis das Ziel erreicht ist oder ein Mensch eingreifen muss

Der Unterschied zum klassischen Prompting: Der Agent durchläuft diesen Zyklus selbstständig. Er versteht das Ziel, beobachtet echte Ergebnisse und korrigiert sich, ohne dass jemand bei jedem Schritt nachhilft.

Wie weit das tragen kann, zeigt Boris Cherny selbst: In 30 Tagen hat er 259 Pull Requests mit Claude Code gemerged, alle vom Agenten geschrieben, während die Loops liefen. Eine IDE hat er nach eigener Aussage den ganzen Monat nicht geöffnet.

Wo werden Loops eingesetzt? Fünf Beispiele aus der Praxis

1. Software-Entwicklung

Das häufigste Einsatzgebiet. Ein Loop schreibt Code, lässt ihn gegen die Tests laufen, korrigiert bei Fehlern automatisch und bereitet am Ende einen Pull Request vor.

Wie weit man das treiben kann, zeigt Geoffrey Huntley. Er baute mit seinem «Ralph Loop» eine komplette Programmiersprache. Der Loop war im Kern ein Bash-Skript, das Claude Code immer wieder aufrief, mit einer Datei voller Regeln, die der Agent zwischen den Durchläufen las und ergänzte. Materialkosten: 297 Dollar.

2. Forschung und Analyse

Karpathy beschreibt seinen Research-Loop so:

Ein Agent mit Zugriff auf eine einzelne Datei
Eine objektiv messbare Metrik
Ein festes Zeitlimit pro Experiment

Der Agent probiert eine Idee aus, misst das Ergebnis gegen die Metrik, verwirft oder behält sie und probiert die nächste. Tausende kleiner Experimente, die kein Mensch von Hand durchführen würde. Karpathys Erkenntnis dazu: «Wenn Sie eine objektive Metrik haben, sollten Sie nicht im Loop sein.»

3. Issue-Triage und Support

Zach Lloyd von Warp beschreibt verschachtelte Loops:

Innerer Loop: klassifiziert eingehende Support-Issues automatisch, vergibt Priorität und Kategorie.
Äusserer Loop: beobachtet, wenn ein Mensch eine Klassifizierung korrigiert, und passt die Regeln des inneren Loops an.

Das Ergebnis ist ein System, das jede Woche etwas treffsicherer wird, weil es aus den Korrekturen der echten Mitarbeiter lernt. Niemand schreibt dafür neue Regeln von Hand.

4. Content-Produktion

Auch dieser Artikel ist ein Beispiel. Bei NETNODE läuft Content durch einen Loop: Ein Agent schreibt einen Entwurf, prüft ihn gegen einen Styleguide, der typische AI-Floskeln und falsche Schreibweisen abfängt, und überarbeitet so lange, bis der Text die Regeln besteht. Erst dann landet er bei einem Menschen zur Freigabe. Der Mensch entscheidet über Inhalt und Ton, nicht über Kommafehler.

5. Proaktives Server-Monitoring bei NETNODE

Bei NETNODE arbeitet ein Agent namens Nils als DevOps-Kollege im Loop. Mindestens einmal pro Tag prüft er den Zustand unserer Server, und zwar nicht nur die Erreichbarkeit. Nils kontrolliert über 30 Datenpunkte: Fehler in den Logs, ungewöhnliche Last, verdächtige Muster in den Zugriffslogs, mögliche Angriffsvektoren und mehr.

Findet Nils ein Problem, handelt er selbstständig: Er eröffnet ein Ticket und schickt einen Alert an das Team. So sehen wir eine Störung oft, bevor ein Kunde sie überhaupt bemerkt. Der Loop läuft still im Hintergrund. Ein Mensch wird erst gerufen, wenn es etwas zu entscheiden gibt.

Was macht einen guten Loop aus?

Ein Loop ist nur so gut wie das Feedback, das ihn steuert. Vier Dinge entscheiden über Erfolg oder teures Scheitern.

Echtes Feedback

Ein Loop ohne Widerstand ist ein Agent, der sich selbst zustimmt. Die zuverlässigsten Signale sind die, die man nicht diskutieren kann: CI-Pipelines, Unit-Tests, Type-Checks, Linter, Browser-Tests, messbare Zahlen. Ein Test ist grün oder rot. Ein Agent kann sich das nicht schönreden.

Klare Erfolgskriterien

Vage Ziele führen zu endlosem Wandern. Ein guter Loop hat eine Definition von «fertig» und klare Punkte, an denen er stoppt und einen Menschen fragt.

Isolation

Mehrere Agenten parallel brauchen harte Grenzen. Getrennte Branches, getrennte Arbeitskopien, getrennte Umgebungen. Kein Agent darf die Arbeit eines anderen überschreiben.

Persistenter Kontext

Loops sterben, wenn jede Iteration bei null beginnt. Was der Agent gelernt hat, muss in die nächste Runde mitgenommen werden, über eine Regeldatei oder ein Memory-System. Sonst macht der Loop in Durchlauf zehn denselben Fehler wie in Durchlauf eins.

Zwischen Hype und Realität

Loop Engineering wird gerade gefeiert, und das aus gutem Grund. Aber dieselben Leute, die die Methode propagieren, liefern auch die Warnungen.

Peter Steinberger postete einen Screenshot über 20'000 Dollar Token-Kosten an einem einzigen Tag. Nächtliche Loops nannte er «die ultimative Token-Verbrennungsmaschine». In einem dokumentierten Fall gerieten vier Agenten in eine endlose Schleife, tauschten elf Tage lang Anfragen aus und verursachten 47'000 Dollar Kosten, bevor jemand den Stecker zog.

Die ehrliche Einordnung: Loops funktionieren glänzend dort, wo Feedback objektiv und billig zu prüfen ist. Ein Test läuft in Sekunden und kostet fast nichts. Wo das Ziel dagegen unscharf ist («mach die Seite schöner») oder die Prüfung selbst teuer wird, verliert ein Loop schnell die Orientierung und das Budget.

Darum braucht jeder produktive Loop Grenzen:

Iterations-Limit: eine harte Obergrenze für Durchläufe, etwa 25
Token-Budget: maximale Kosten pro Agent und pro Lauf
Zeit-Limit: maximale Laufzeit pro Session
Abbruch ohne Fortschritt: wenn der Agent sich im Kreis dreht, stoppen

Die wichtigste Regel: Nicht der Agent ist für sein eigenes Ende verantwortlich, sondern das System, das ihn ausführt. Ein Agent, der entscheiden darf, wann er aufhört, hört oft nicht auf.

Der Hype ist also halb berechtigt. Die Methode ist real und stark. Sie ist nur kein Selbstläufer, sondern verlangt sauberes Engineering.

Der Mensch im Loop

Loop Engineering ersetzt den Menschen nicht. Es verschiebt seine Rolle.

Der Mensch definiert das Ziel. Er baut die Feedback-Mechanismen. Er legt fest, wann ein Agent fragen soll, statt zu handeln. Und er greift ein, wenn sein Urteil gebraucht wird, nicht bei jeder Kleinigkeit.

Karpathy berichtet, dass seine Fähigkeit, von Hand zu programmieren, nachlässt, während seine Fähigkeit, Systeme zu entwerfen, wächst. Das ist die Verschiebung in einem Satz: weg vom Tippen, hin zum Konstruieren der Schleife.

Was bedeutet das für Ihr Projekt?

Sie müssen nicht über Nacht 259 Pull Requests automatisieren. Der Einstieg ist kleiner und konkreter.

Suchen Sie eine Aufgabe in Ihrem Team, die sich wiederholt und ein klares, prüfbares Ergebnis hat. Eine Test-Suite, die grün sein muss. Eine Datenmigration, die gegen eine Prüfsumme läuft. Ein Reporting, das jede Woche dasselbe Format braucht. Genau dort spielt ein Loop seine Stärke aus, weil das Feedback eindeutig und billig ist.

Fangen Sie klein an, mit Limits von Anfang an, und lassen Sie den ersten Loop unter Aufsicht laufen. Die teuren Fehler entstehen nicht durch zu kleine, sondern durch zu grosse, ungebremste erste Schritte.

Lassen Sie uns darüber sprechen

Sie wollen wissen, wo sich ein Agent Loop in Ihrem Projekt lohnt und wo nicht? Wir schauen uns Ihre Abläufe an und zeigen Ihnen, wo Loop Engineering konkret etwas bringt. Das erste Gespräch ist immer kostenlos.

Jetzt Kontakt aufnehmen

Quellen

The New Stack: Loop Engineering – Boris Cherny über seinen Workflow
Office Chai: Claude Code Creator Says He Didn't Open An IDE All Of Last Month – 259 Pull Requests ohne IDE
Cobus Greyling: Loop Engineering – Peter Steinbergers Loop-Design-These
Next Big Future: Andrej Karpathy on the Loopy Era of AI – Karpathys AutoResearch
Anthropic: How Warp builds self improving agents – Zach Lloyd über innere und äussere Loops
Geoffrey Huntley: Ralph Wiggum as a software engineer – Der Ralph Loop
Tom's Hardware: OpenClaw creator burns through $1.3 million in OpenAI tokens – Steinbergers Token-Verbrauch
DEV Community: The $47,000 Agent Loop – LangChain Runaway-Kosten-Fall

Was ist Loop Engineering?

Inhaltsverzeichnis