Die Agenten sind da. Die Leitplanken nicht.

Warum die angesagtesten KI-Coding-Agenten im Enterprise scheitern und wie die Governance-first-Alternative aussieht.

An einem Montagmorgen im April öffnete ein Senior Engineer bei AMD ein Terminal, richtete Claude Code auf eine komplexe Codebasis und beobachtete, wie der KI-Agent eine scheinbar funktionierende Lösung produzierte. Dann schaute er genauer hin. Der Agent hatte „die schwierigen Teile überflogen“, schrieb er später; er generierte plausiblen Code, der die wirklich schwierigen Engineering-Probleme umging, statt sie zu lösen. Es war ein kleiner Moment, der eine große Wahrheit einfing: Die gefeiertsten KI-Agenten in der Softwareentwicklung sind auf Developer Experience optimiert, nicht auf Enterprise-Zuverlässigkeit. Und während Unternehmen sie eilig einsetzen, wird die Kluft zwischen dem, was diese Tools versprechen, und dem, was Enterprise-Umgebungen erfordern, immer schwerer zu ignorieren.

88%21K+$4.63M14%
SICHERHEITSVORFÄLLE Gravitee, 2026EXPONIERTE INSTANZEN The Hacker News (OpenClaw)DURCHSCHN. KOSTEN PRO VORFALL IBM Cost of a Data BreachGO-LIVE GENEHMIGT Gravitee-Umfrage

Der Goldrausch

Die Zahlen sind atemberaubend. OpenClaw hat 135.000 GitHub-Stars überschritten und ist damit eines der am schnellsten wachsenden Open-Source-Projekte der Geschichte. Claude Code, Anthropics agentischer Coding-Assistent, wurde von der einflussreichen Forschungsfirma SemiAnalysis als „Wendepunkt“ für KI-gestützte Entwicklung bezeichnet. OpenAI veröffentlichte Codex, seinen eigenen Coding-Agenten, als Open Source, mit breiter Begeisterung unter Entwicklern. Im gesamten Silicon Valley und darüber hinaus ist das Narrativ einhellig: KI-Agenten, die autonom Code schreiben, debuggen und deployen können, repräsentieren die Zukunft des Software-Engineering.

Entwickler lieben diese Tools und das aus gutem Grund. Sie komprimieren Stunden von Boilerplate-Code in Minuten, navigieren unbekannte Codebasen mit überraschender Geläufigkeit und machen einzelne Programmierer dramatisch produktiver. Eine aktuelle Studie ergab, dass 93 Prozent der Unternehmen inzwischen KI-generierten Code in die Produktion überführen. Der Goldrausch ist real.

Doch Enterprise-Sicherheitsteams beobachten das mit zunehmender Besorgnis. Dieselbe Geschwindigkeit, die diese Agenten für Entwickler aufregend macht, macht sie für CISOs beängstigend. Diese Tools arbeiten mit Terminal-Level-Zugriff, generieren Code mit 30 Prozent mehr Schwachstellen als manuell geschriebene Alternativen (SQ Magazine) und existieren fast vollständig außerhalb der Governance-Frameworks, die Unternehmen über Jahrzehnte aufgebaut haben. Die Frage ist nicht mehr, ob KI-Agenten programmieren können. Die Frage ist, ob sie innerhalb der Rahmenbedingungen programmieren können, die Enterprise-Umgebungen vorgeben.

Warum Enterprise anders ist

Die Diskrepanz zwischen entwicklerorientierten Coding-Agenten und Enterprise-Anforderungen ist keine Frage der Reife. Sie ist strukturell. Fünf fundamentale Lücken trennen das, was diese Tools bieten, von dem, was große Organisationen brauchen.

Die Governance-Lücke ist die offensichtlichste. Coding-Agenten arbeiten als Einzeltools ohne eingebaute Audit-Trails, ohne zentrale Aufsicht und ohne Policy-Durchsetzung. Eine Gravitee-Umfrage unter Sicherheitsexperten ergab, dass nur 14,4 Prozent der KI-Agenten mit vollständiger Sicherheits- und IT-Freigabe live gehen; was bedeutet, dass die überwiegende Mehrheit als Schatten-KI eingesetzt wird, unsichtbar für die Teams, die für das organisatorische Risiko verantwortlich sind. Nur 24,4 Prozent der Organisationen berichten von vollständiger Transparenz bei der Agent-zu-Agent-Kommunikation (Gravitee, 2026). Für Unternehmen, die SOX, DSGVO oder dem EU AI Act unterliegen, deren Durchsetzungsfrist im August 2026 nur noch Monate entfernt ist, ist das keine Lücke. Es ist ein Ausschlusskriterium.

Die Kostenkontrolllücke ist ebenso folgenreich. Anders als traditionelle Enterprise-Software mit kalkulierbarer Pro-Nutzer-Lizenzierung verwenden Coding-Agenten verbrauchsbasierte Preismodelle, die mit jedem Tastendruck skalieren. OpenAIs eigenes Community-Forum ist voller Nutzer, die Codex‘ Ökonomie als „unzumutbar und nicht tragfähig“ bezeichnen (OpenAI Community). PYMNTS berichtete, dass Claude Codes nutzungsbasiertes Modell „die Kosten für Vielnutzer verdoppeln oder verdreifachen“ könnte. Für einen CFO, der KI-Ausgaben über Tausende von Entwicklern prognostizieren muss, ist das ein budgetärer Alptraum.

Die Sicherheitslücke hat sich von theoretisch zu real verschoben. Gravitees 2026-Umfrage ergab, dass 88 Prozent der Organisationen im vergangenen Jahr KI-Agenten-Sicherheitsvorfälle meldeten. The Hacker News dokumentierte über 21.000 exponierte OpenClaw-Instanzen und nannte es die „erste große KI-Agenten-Sicherheitskrise 2026″. IBMs aktueller Cost of a Data Breach-Report bezifferte die durchschnittlichen Kosten eines Schatten-KI-Vorfalls auf 4,63 Millionen US-Dollar. Gleichzeitig stufen 48 Prozent der Sicherheitsexperten agentische KI als den wichtigsten Angriffsvektor des Jahres ein (Dark Reading).

Die Zuverlässigkeitslücke besteht trotz schneller Iterationen fort. AMDs Senior Director of Software Development kritisierte Claude Code öffentlich dafür, Output zu produzieren, der wirklich schwierige Probleme umgeht, ein Muster, das er als „Überfliegen der schwierigen Teile“ charakterisierte (InfoWorld). Für Enterprise-Codebasen, in denen die schwierigen Teile der eigentliche Punkt sind, ist das keine geringfügige Einschränkung.

„KI-Agenten überfliegen die schwierigen Teile. Sie generieren plausiblen Code, der die wirklich schwierigen Engineering-Probleme umgeht, statt sie zu lösen.“ – AMD Senior Director of Software Development (InfoWorld)

Schließlich schwebt die organisatorische Readiness-Lücke über allem. Eine umfassende Writer-Umfrage ergab, dass 79 Prozent der Unternehmen trotz hoher KI-Investitionen Adoptionsherausforderungen haben, und 54 Prozent der C-Suite-Führungskräfte sagen, KI „reiße ihr Unternehmen auseinander“. Unter Führungskräften von Unternehmen mit über 1 Milliarde US-Dollar Umsatz sagen 71 Prozent, dass organisatorische Bereitschaft, nicht technologische Fähigkeit, die primäre Grenze für den KI-Einsatz sei (Writer, 2026). Die Tools sind leistungsfähig. Die Organisationen sind nicht bereit.

Die gesteuerte Alternative

Es gibt einen anderen Ansatz für agentische KI, einen, der mit Governance beginnt, nicht mit Geschwindigkeit. Zwei Plattformen haben ihre agentischen Strategien auf der Prämisse aufgebaut, dass Enterprise-KI auditierbar, kontrollierbar und per Design compliant sein muss: UiPath und Microsoft.

UiPaths Ansatz konzentriert sich auf das, was das Unternehmen „den gesteuerten Agenten“ nennt. Anfang 2026 führte UiPath AIUC-1 ein, die erste Compliance-Zertifizierung, die speziell für die Sicherheit von KI-Agenten entwickelt wurde. Sein Unified Audit 2.0-System bietet eine einzige Quelle der Wahrheit für jede Aktion, die von jedem Agenten im gesamten Unternehmen durchgeführt wird. Policy-as-Code-Governance ermöglicht es Organisationen, Regeln darüber zu definieren, zu versionieren und durchzusetzen, was Agenten tun dürfen und was nicht – mit derselben Strenge, die sie bei Infrastructure-as-Code anwenden. Und die Maestro-Orchestrierungs-Engine koordiniert Menschen, Software-Bots und KI-Agenten in einheitlichen Workflows mit vollständiger Auditierbarkeit bei jedem Schritt.

Entscheidend ist: UiPath integriert Anthropics Claude-Modelle nativ in seine Plattform. Das bedeutet, dass Unternehmen auf dieselbe zugrunde liegende KI-Fähigkeit zugreifen können, die Claude Code antreibt, aber eingebettet in die Audit-Trails, Zugriffskontrollen und Compliance-Frameworks, die Enterprise-Umgebungen erfordern. Die KI ist nicht der Differenzierungsfaktor. Der Governance-Wrapper ist es.

Microsofts Ansatz ist architektonisch ähnlich, aber operativ unterschiedlich. Das Unternehmen hat Governance direkt in sein Copilot-Ökosystem eingebettet durch eine „Governance-first-Architektur“: Data Loss Prevention für Prompts, Insider Risk Management für Agentenverhalten, Data Lifecycle Management für Aufbewahrung sowie vollständige Audit- und eDiscovery-Funktionen. Das Wave-3-Release im März 2026 markierte Copilots Transformation von einem passiven Assistenten zu einem autonomen Agenten, der mehrstufige Workflows ausführen kann – aber innerhalb desselben Governance-Perimeters, der den Rest des Microsoft 365-Ökosystems kontrolliert (Microsoft 365 Blog).

Der wirtschaftliche Case ist überzeugend. Eine Forrester Total Economic Impact-Studie ergab, dass Microsoft 365 Copilot über drei Jahre einen ROI von 116 Prozent liefert, wobei Nutzer durchschnittlich 26 Minuten pro Tag einsparen. Microsofts eigene Daten weisen auf ein Verhältnis von 28:1 hin: 11 Stunden Einsparung pro Nutzer und Monat im Wert von etwa 825 US-Dollar Produktivität, bei einer monatlichen Lizenzgebühr von 30 US-Dollar. Custom Agents in Copilot Studio liefern das Drei- bis Fünffache des ROI von Basis-Copilot-Deployments (EPC Group). Das sind keine experimentellen Zahlen. Es sind Enterprise-grade Unit Economics.

Die folgende Vergleichstabelle fasst die strukturellen Unterschiede zusammen:

DimensionCoding-Agenten
(Claude Code / Codex / OpenClaw)
Enterprise-Plattformen
(UiPath / Microsoft)
Governance
& Audit
Kein eingebauter Audit-Trail; Terminal-Level-Zugriff; nur 14,4 % erhalten vollständige Sicherheits-/IT-Freigabe (Gravitee)AIUC-1-Compliance-Zertifizierung; Unified Audit 2.0; Policy-as-Code-Governance; DLP für Prompts (UiPath / Microsoft)
KostenmodellNutzungsbasierte Preise mit unvorhersehbarer Skalierung; Codex als „unzumutbar und nicht tragfähig“ bezeichnet (OpenAI Community); Claude Code könnte „Kosten verdoppeln oder verdreifachen“ (PYMNTS)Pro-Nutzer-Lizenzierung mit kalkulierbaren Budgets; 28:1 ROI bei Copilot (825 $ Wert vs. 30 $/Monat Lizenz); 116 % ROI über 3 Jahre (Forrester / Microsoft)
Security
Postur
88 % der Organisationen melden KI-Agenten-Sicherheitsvorfälle (Gravitee); 21.000+ exponierte OpenClaw-Instanzen (The Hacker News); 4,63 Mio. $ durchschn. Kosten eines Schatten-KI-Vorfalls (IBM)Insider Risk Management; Data Lifecycle Management; eDiscovery und Audit; Governance-first-Architektur von Tag eins (Microsoft Security Blog)
Compliance
Readiness
Keine EU-AI-Act-Konformität; keine zentralisierte Agentenkontrolle; nur 12 % der Unternehmen haben zentrale Aufsicht (OutSystems/EY)Für regulierte Branchen gebaut; EU-AI-Act-konforme Audit-Trails; AIUC-1 als erster Compliance-Standard für KI-Agenten-Sicherheit (AI Bucket / UiPath)
OrchestrierungSingle-Agent-, Single-Developer-Workflow; keine Multi-Agent-Koordination; AMD-Kritik: „überfliegt die schwierigen Teile“ (InfoWorld)UiPath Maestro: Mensch + Bot + KI-Agent-Orchestrierung; Microsoft Wave 3: Assistent → autonomer Agent; Copilot Studio Custom Agents liefern 3–5x ROI (EPC Group)

Die bevorstehende Konvergenz

Hier ist die Nuance, die im Rauschen untergeht: Diese Welten konvergieren. UiPath betreibt Claude bereits unter der Haube. Microsoft integriert OpenAI-Modelle in seinen gesamten Stack. Die zugrunde liegenden KI-Fähigkeiten werden zunehmend zur Commodity, verfügbar für jeden mit einem API-Key und einer Kreditkarte. Was keine Commodity ist, ist die Governance-, Orchestrierungs- und Compliance-Infrastruktur, die diese Fähigkeiten sicher im Enterprise-Maßstab einsetzbar macht.

Die Frage für IT-Verantwortliche ist nicht, welches KI-Modell das Beste ist. Es ist der Wrapper um das KI-Modell, der die Auditierbarkeit, Kostenvorhersagbarkeit und Sicherheit bietet, die ihre Organisation erfordert. Coding-Agenten wie Claude Code, Codex und OpenClaw werden sich weiterentwickeln und sie werden irgendwann Enterprise-Features haben. Aber „irgendwann“ ist keine Strategie, wenn die Durchsetzungsfrist des EU AI Act im August 2026 liegt, wenn 88 Prozent der Organisationen bereits agentenbezogene Sicherheitsvorfälle erleben und wenn der durchschnittliche Vorfall 4,63 Millionen US-Dollar kostet.

Unternehmen, die darauf warten, dass Coding-Agenten zu Enterprise-grade-Plattformen heranreifen, werden 12 bis 18 Monate verlieren. Diejenigen, die heute gesteuerte Agentenplattformen einsetzen und dieselben zugrunde liegenden KI-Modelle in einen Enterprise-Wrapper einbinden, realisieren die Produktivitätsgewinne sofort und bauen gleichzeitig die Compliance- und Governance-Grundlagen auf, die innerhalb des Jahres nicht verhandelbar sein werden. Nur 12 Prozent der Unternehmen verfügen derzeit über eine zentralisierte Agentenkontrolle (OutSystems/EY). Die First Mover bei Governance werden den Standard für alle anderen setzen.

Was das für Ihre Organisation bedeutet

Für IT-Entscheider, die ihre agentische KI-Strategie evaluieren, sollten drei Prinzipien die nächsten zwölf Monate leiten.

Erstens: Auditieren vor Automatisieren. Katalogisieren Sie jeden KI-Agenten, der derzeit in Ihrer Umgebung arbeitet, sowohl genehmigt als auch nicht genehmigt. Wenn Sie nicht alle benennen können, haben Sie ein Schatten-KI-Problem, und die Daten deuten darauf hin, dass Sie es mit ziemlicher Sicherheit haben. Erst Transparenz schaffen, dann Fähigkeiten.

Zweitens: Plattformen wählen, nicht Einzeltools. Individuelle Coding-Agenten mögen aufregender sein, aber Enterprise-Plattformen mit eingebauter Governance – UiPaths Maestro, Microsofts Copilot-Ökosystem – bieten die Audit-Trails, Kostenkontrollen und Compliance-Readiness, die Regulierer und Vorstände einfordern werden. Die KI ist austauschbar. Die Governance-Schicht ist das, was sie Enterprise-sicher macht.

Drittens: Governance als Wettbewerbsvorteil behandeln, nicht als Overhead. Organisationen, die Compliance von Anfang an in ihre agentische Architektur einbauen, werden schneller vorankommen – nicht langsamer – als diejenigen, die sie nachträglich aufsetzen. Jeder Monat unkontrollierten Agenten-Einsatzes ist ein Monat, in dem sich technische, rechtliche und reputationsbezogene Schulden anhäufen.

Lunatec arbeitet als UiPath Diamond Partner und Microsoft Partner mit Hauptsitz in Frankfurt und Büros in Dubai an der Schnittstelle dieser Plattformen. Wir unterstützen Unternehmen bei der Konzeption gesteuerter agentischer Architekturen – von der Plattformauswahl und Policy-Gestaltung bis zur Produktionsorchestierung und EU-AI-Act-Readiness. Die Agenten sind da. Die Frage ist, ob Ihre Leitplanken es auch sind.

Quellen:

Gravitee 2026 Survey https://www.gravitee.io/blog/state-of-ai-agent-security-2026-report-when-adoption-outpaces-control                                  

The Hacker News / Cyber Press https://thehackernews.com/2026/02/clawjacked-flaw-lets-malicious-sites.html                                                         

IBM Cost of a Data Breach 2025 https://www.ibm.com/reports/data-breach

Dark Reading https://www.darkreading.com/threat-intelligence/2026-agentic-ai-attack-surface-poster-child

SQ Magazine https://sqmagazine.co.uk/ai-coding-security-vulnerability-statistics/

Writer 2026 Survey https://writer.com/blog/enterprise-ai-adoption-2026/

InfoWorld https://www.infoworld.com/article/4154973/enterprise-developers-question-claude-codes-reliability-for-complex-engineering.html

OpenAI Community https://community.openai.com/t/understanding-the-new-codex-limit-system-after-the-april-9-update/1378768

PYMNTS https://www.pymnts.com/artificial-intelligence-2/2026/anthropic-switches-to-usage-based-billing-for-enterprise-customers/

AI Bucket / AIUC-1 https://www.aibucket.io/post/uipath-gains-aiuc-certification-ai-agent-security

UiPath https://www.uipath.com/blog/product-and-updates/agentic-enterprise-governance-and-security-2025-10-release

Microsoft Security Blog https://www.microsoft.com/en-us/security/blog/2026/03/09/secure-agentic-ai-for-your-frontier-transformation/

Forrester TEI  https://tei.forrester.com/go/microsoft/M365Copilot/

Microsoft / EPC Group https://www.epcgroup.net/blog/copilot-pricing-licensing-enterprise-guide

Microsoft 365 Blog https://www.microsoft.com/en-us/microsoft-365/blog/2026/03/09/powering-frontier-transformation-with-copilot-and-agents

OutSystems  https://www.businesswire.com/news/home/20260407749542/en/Agentic-AI-Goes-Mainstream-in-the-Enterprise-but-94-Raise-Concern-About-Sprawl-OutSystems-Research-Finds