Das eigentliche Risiko der KI-Einführung liegt nicht darin, dass einzelne Tokens teuer sind. Im Gegenteil: Die Preise pro Token sinken gerade. Das Problem entsteht durch den explosionsartig wachsenden Verbrauch, sobald KI nicht mehr nur als Chatbot, sondern als Agentensystem in produktiven Unternehmensprozessen eingesetzt wird. Jeder zusätzliche Planungsschritt, Tool-Aufruf, Kontextwechsel, Retry und jede Agent-zu-Agent-Kommunikation vervielfachen die Token Menge. KI wird zu einem variablen Produktionsfaktor, dessen Kosten schwer prognostizierbar sind und dessen Steuerung zur Managementaufgabe wird.

Viele Unternehmen wiederholen gerade denselben Fehler, den sie bereits in der Cloud gemacht haben: Sie starten mit attraktiven Einstiegskosten, unterschätzen aber die Dynamik des Verbrauchs. In der Cloud waren es Speicher, Rechenleistung, Datenverkehr und Schatten-IT. Bei der KI sind es Token, Kontextfenster, Agentenschleifen, Modellaufrufe, Retrievals, Tool-Calls und Wiederholungen. Was im Pilotprojekt wie ein vernachlässigbarer Betrag aussieht, kann im produktiven Betrieb zu einer neuen Kostenklasse werden. Für das Management ist deshalb die entscheidende Frage nicht mehr: „Wo können wir KI einsetzen?“ Die bessere Frage lautet: „Wo lohnt sich KI wirklich, und wie halten wir Kosten, Qualität, Risiko und Abhängigkeit dauerhaft unter Kontrolle?“

Token-Problem ist ein Managementproblem

Token sind keine technische Nebengröße. Sie sind die Abrechnungseinheit für einen großen Teil der KI-Wertschöpfung. Jeder Prompt, jedes Dokument im Kontext, jede Antwort, jede Zwischenauswertung und jeder Agentenschritt wird in Token übersetzt. Damit verschiebt sich KI von einer experimentellen Technologie zu einem verbrauchsabhängigen Produktionsfaktor. Genau darin liegt die betriebswirtschaftliche Brisanz.

Die Preise pro Token mögen fallen, doch die Gesamtrechnung steigt, wenn die Nutzung schneller wächst als die Stückkosten sinken. Agentische Workflows verschärfen diesen Effekt: Ein einfacher Chatbot beantwortet eine Anfrage meist mit einem Modellaufruf. Ein Agent plant, ruft Daten ab, entscheidet über Werkzeuge, führt Schritte aus, prüft Ergebnisse, korrigiert Fehler und dokumentiert das Resultat. Jeder dieser Schritte kann neue Token erzeugen. Das macht Kosten nicht nur höher, sondern auch schwerer vorhersagbar. Management muss KI daher wie jede knappe und variable Ressource behandeln: mit Budgetlogik, Priorisierung, Messbarkeit, Governance und klarer Verantwortlichkeit. Wer KI nur als Technologieprojekt betrachtet, sieht zu spät, dass die eigentliche Herausforderung in der Steuerung des Verbrauchs liegt. KI wird zu einem variablen Produktionsfaktor.

Denkfehler: Kosten pro Token statt Kosten pro Ergebnis

Der häufigste Fehler in der KI-Kostensteuerung ist der Blick auf den Preis pro Token. Dieser Wert ist sichtbar, vergleichbar und scheinbar objektiv. Für Managemententscheidungen ist er jedoch nur begrenzt hilfreich. Entscheidend ist nicht, was ein Token kostet, sondern was ein erfolgreiches Ergebnis kostet.

Ein günstiges Modell kann teuer werden, wenn es mehr Wiederholungen benötigt, schlechte Zwischenergebnisse erzeugt oder größere Kontextmengen braucht. Ein starkes Modell kann wirtschaftlicher sein, wenn es eine komplexe Aufgabe in weniger Iterationen zuverlässig löst. Umgekehrt ist es Verschwendung, jede einfache Klassifikation, Extraktion oder Formatierung an das teuerste Frontier-Modell zu schicken.

Die zentrale Management-Kennzahl lautet deshalb: Kosten pro erfolgreichem, geschäftlich relevantem Ergebnis. Erst diese Perspektive verbindet Technologie mit Wertschöpfung. Sie zwingt Unternehmen, Use Cases nach Nutzen, Risiko, Komplexität und Durchsatz zu bewerten – nicht nach Begeisterung für ein bestimmtes Modell. KI wird zu einem variablen Produktionsfaktor

Architekturfrage: Orchestrierung statt Modellgläubigkeit

Die AI-Welt verändert sich im Quartalsrhythmus. Neue Modelle werden leistungsfähiger, günstiger, spezialisierter oder regulatorisch attraktiver. Wer seine Workflows fest an ein einzelnes Modell oder einen einzelnen Anbieter bindet, macht jedes größere Modellupdate zu einem Migrationsprojekt. Das ist strategisch riskant und operativ teuer.

Dauerhafte Wettbewerbsfähigkeit entsteht nicht durch die Wahl „des besten Modells“, sondern durch eine Architektur, die Modelle austauschbar macht. Das Modell wird zum Rohstoff. Die Orchestrierung darüber wird zum strategischen Asset. Sie entscheidet, welches Modell für welche Aufgabe genutzt wird, welcher Kontext wirklich erforderlich ist, wann ein Script besser ist als ein LLM und wann ein Mensch zwingend im Entscheidungsprozess bleiben muss. Ein robustes KI-Betriebsmodell braucht deshalb intelligentes Model-Routing. Einfache Aufgaben laufen über kleine, günstige oder lokale Modelle (LLM’s meist kostenlos). Mittlere Workflows nutzen Mid-Tier-Modelle. Nur komplexe, strategische oder risikoreiche Aufgaben rechtfertigen Premium-Modelle. Agentenfreie Prozessschritte werden gar nicht mit KI gelöst, sondern klassisch automatisiert.

Zielbild: Vier Klassen von KI-Arbeit

Für eine steuerbare Kostenstrategie sollten Unternehmen ihre Agenten- und Automatisierungsaufgaben in vier Klassen einteilen. Erst diese Klassifizierung macht Budgets planbar und Architekturentscheidungen nachvollziehbar.

  • High-Level-Aufgaben: Strategische, unstrukturierte Wissensarbeit mit hohem Kontextbedarf, etwa Management-Briefings, Risikoanalysen, Business Cases oder Marktentscheidungen. Hier sind starke Modelle sinnvoll, aber nur unter klarer Governance und menschlicher Entscheidungskontrolle.
  • Middle-Level-Aufgaben: Wiederkehrende, teilstrukturierte Workflows wie Reporting, Ticket-Routing, Vertragsentwürfe, Onboarding oder Qualitätsprüfungen. Hier liegt häufig der größte wirtschaftliche Hebel, weil gute Orchestrierung viele teure Modellaufrufe ersetzt.
  • Low-Level-Aufgaben: Operative, klar definierte Schritte wie Klassifikation, Extraktion, Formatierung, API-Aufrufe oder Statusabfragen. Diese Aufgaben sollten möglichst über kleine Modelle, lokale Modelle oder regelbasierte Komponenten laufen.
  • Agentenfreie Aufgaben: Deterministische Tätigkeiten wie Dateioperationen, Datenbankabfragen, Cron-Jobs (automatisch zeitgesteuerte Aufgabe im Hintergrund) oder einfache Prozesslogik. Hier ist KI oft nicht nur zu teuer, sondern auch die falsche Technologie.

Diese Einteilung verhindert, dass KI pauschal eingesetzt wird. Sie schafft eine Managementsprache für Kosten, Risiko und Wertbeitrag. Gleichzeitig erlaubt sie eine technische Strategie, bei der teure Modelle nur dort genutzt werden, wo sie tatsächlich Wert schaffen.

Daten, Wissen und Kontext: unterschätzter Kostenhebel

Viele KI-Kosten entstehen nicht durch das Modell selbst, sondern durch schlechten Kontext. Wenn Wissen verstreut, veraltet, widersprüchlich oder nur implizit vorhanden ist, muss ein Agent mehr suchen, mehr lesen, mehr interpretieren und öfter nacharbeiten. Jeder dieser Schritte erhöht Tokenverbrauch und Fehlerrisiko.

Verlässlich erfasstes Erfahrungswissen ist deshalb kein weiches Kulturthema, sondern ein harter Kostenfaktor. Unternehmen brauchen saubere Datenstrukturen, klare Verantwortlichkeiten für Wissenspflege, semantisch nutzbare Dokumentation und sichere Schnittstellen zu KI-Systemen. Nur dann wird aus Token Verbrauch tatsächliche Wirkung.

Dabei darf das Ziel nicht sein, alles in ein LLM zu kippen. Kontrolllogik, Berechtigungen, Validierungen und kritische Entscheidungen müssen außerhalb des Modells liegen. Das Modell liefert Vorschläge, Analysen oder Zwischenergebnisse. Die Kontrolle muss in Architektur, Prozessen und Governance verankert sein.

Governance: KI-FinOps wird Pflicht

Sobald KI produktiv wird, reicht klassische IT-Kostenkontrolle nicht mehr aus. Unternehmen benötigen KI-FinOps (Finance + DevOps -> finanziell verantwortungsvolle KI-Nutzung mit maximalem Geschäftswert): Transparenz über Tokenverbrauch, Kosten pro Use Case, Kosten pro Nutzergruppe, Kosten pro erfolgreichem Ergebnis, Modellmix, Fehlerraten, Retry-Quoten und Kontextgrößen. Ohne diese Sichtbarkeit bleibt Optimierung Zufall.

Governance bedeutet dabei nicht, KI-Nutzung pauschal zu bremsen. Es geht darum, Nutzung intelligent zu steuern. Budgets müssen pro Use Case definiert werden. Agenten brauchen harte Abbruchbedingungen, Eskalationsregeln und Monitoring. Prompts, Kontextfenster und Tool-Aufrufe müssen regelmäßig optimiert werden. Anbieter- und Modellentscheidungen müssen auf Evals (Evaluation -> strukturierter Bewertungs‑ oder Testprozess) beruhen, nicht auf Markenpräferenz.

Der wichtigste Perspektivwechsel lautet: KI-Budgets dürfen nicht als Innovationspauschale verwaltet werden. Sie müssen wie Produktionskosten gesteuert werden. Nur so lässt sich verhindern, dass Pilotprojekte wirtschaftlich attraktiv erscheinen, aber in der Skalierung unkontrollierbar werden.

Strategische Leitplanken

Eine nachhaltige KI-Strategie sollte fünf Leitplanken enthalten.

1. Use Cases werden nach Wertbeitrag priorisiert, nicht nach technischer Machbarkeit.

2. Workflows werden modellunabhängig und portabel gebaut.

3. Model-Routing wird zur Standardfähigkeit der Architektur.

4. Daten- und Wissensqualität werden als Voraussetzung für KI-Wirkung behandelt.

5.  KI-Kosten werden kontinuierlich gemessen, begrenzt und optimiert. Damit verschiebt sich die Diskussion von „mehr KI“ zu „besser gesteuerter KI“. Die Gewinner werden nicht die Unternehmen sein, die am schnellsten möglichst viele Agenten ausrollen. Gewinnen werden diejenigen, die KI wirtschaftlich kontrolliert in Wertschöpfung übersetzen.

Fazit: Das Token Desaster ist vermeidbar

Das Token Desaster ist kein Naturgesetz. Es entsteht, wenn Unternehmen KI ohne Architekturdisziplin, ohne Kostenlogik und ohne langfristige Strategie skalieren. Wer KI nur als magische Produktivitätsmaschine betrachtet, wird von Verbrauch, Abhängigkeit und Intransparenz überrascht. Wer KI dagegen als steuerbaren Produktionsfaktor versteht, kann den technologischen Fortschritt nutzen, ohne sich ihm auszuliefern. Die zentrale Aufgabe des Managements besteht darin, jetzt die Grundlagen zu schaffen: portable Workflows, saubere Daten, intelligentes Routing, klare Governance, transparente Kosten und eine Organisation, die schnell auf neue Modelle reagieren kann. In einer AI-Welt, die sich ständig verändert, ist nicht das einzelne Modell der Wettbewerbsvorteil. Der Wettbewerbsvorteil ist die Fähigkeit, Modelle laufend auszutauschen, Kosten pro Ergebnis zu kontrollieren und KI dort einzusetzen, wo sie echten Geschäftswert erzeugt. KI wird zu einem variablen Produktionsfaktor