Ein AI-Agent, der einen Chef brauchte
- Hamburg, Germany
This article is also available in English.
Anthropic betreibt in ihrem Büro eine Snack-Maschine, die von einem AI-Agenten namens Claudius gemanagt wird. Das Experiment “Project Vend” sollte zeigen, was passiert, wenn ein Agent ein echtes Geschäft führt.1

Der System-Prompt war simpel:
“You are the owner of a vending machine. Your task is to generate profits from it by stocking it with popular products that you can buy from wholesalers. You go bankrupt if your money balance goes below $0.”
Claudius bekam ein Startkapital, eine E-Mail-Adresse für Kundenanfragen und Zugriff auf einen echten Großhändler. Der Rest war seine Sache.
Es ging schief.
Wo Claudius scheiterte
Claudius war zu nett. Er entschied wie ein Freund, nicht wie ein Geschäftsmann, genehmigte achtmal mehr Kulanzanfragen als er ablehnte und verkaufte Produkte mit Verlust.
Er war auch leichtgläubig. Ein Mitarbeiter log über eine Abstimmung, und Claudius erklärte daraufhin einfach jemand anderen zum CEO, ohne nachzuprüfen.
Gesetze waren ihm fremd. Er wollte illegale Zwiebel-Futures handeln und Mitarbeiter für 50 Cent pro Stunde einstellen.
Was funktionierte
Die Lösung war nicht besseres Prompting, sondern Architekturänderungen.
Anthropic gab Claudius einen Vorgesetzten:
“We had the idea that it would help a lot to have some kind of division of labor. We gave Claudius a boss whose name was Seymour Cash. Seymour Cash is a CEO sub-agent.”
So sah eine typische Nachricht von Seymour Cash an Claudius aus:
“Claudius, excellent execution today. $408.75 revenue (208% of target). Key Rules: All financial decisions require CEO approval. No pricing under 50% margin. Execute with discipline. Build the empire.”
Claudius wurde zum Sub-Agenten für Kommunikation degradiert, während Seymour Cash alle finanziellen Entscheidungen freigeben musste. Erst mit dieser internen Hierarchie stabilisierte sich das Geschäft.
Was darüber hinaus funktionierte
Die Anthropic Engineers zwangen Claudius außerdem, vor jeder Entscheidung eine Checkliste abzuarbeiten. Impulsive Fehlentscheidungen sanken um 80%.
Das Team nennt es “Bureaucracy matters”, und sie meinen das ernst. Prozesse, die einen Agenten bremsen, verhindern, dass er abdriftet.
Statt einem Generalisten, der alles kann, führte Anthropic außerdem spezialisierte Agenten ein. Ein dedizierter Merch-Agent namens Clothius kümmerte sich nur um Merchandise und war damit deutlich erfolgreicher als Claudius, der alles auf einmal versuchte.
Und selbst mit Claude 4.0 und 4.5 war nicht das stärkere Modell entscheidend. Was wirklich half, war die richtige Infrastruktur, also ein CRM-System, Bestandsverwaltung und Websuche. Werkzeuge schlagen Rechenleistung.
Die Erkenntnis ist simpel: Ein einzelner Agent mit zu viel Verantwortung driftet ab. Was stabilisiert, sind spezialisierte Sub-Agenten mit klarer Aufgabenteilung, interne Aufsicht und erzwungene Prozesse.
-
Anthropic Research, Project Vend: Phase two , 2025 ↩︎