- von Aditya Soni
Die leistungsstarken und teuren KI-Modelle aus dem Silicon Valley waren bislang eine Notwendigkeit für Unternehmen, die sich für die Zukunft rüsten wollten. Doch nun argumentieren immer mehr CEOs aus der Tech-Branche, dass günstigere Optionen für eine breitere Akzeptanz entscheidend wären.
Führungskräfte wie Satya Nadella ( NASDAQ:MSFT, Microsoft), Nikesh Arora ( NASDAQ:PANW, Palo Alto Networks) und Brian Armstrong ( NASDAQ:COIN, Coinbase Global) haben erklärt, dass kleinere, kostengünstigere Modelle einen Großteil der Unternehmensanforderungen abdecken können.
Diese Sichtweise ist das Ergebnis einer Neubewertung innerhalb von Unternehmen, die bis vor kurzem noch den intensiven Einsatz von KI-Tools förderten und den steigenden Verbrauch oft als Indikator für Produktivität betrachteten – ein Phänomen, das als „Tokenmaxxing“ bezeichnet wird . Nun beginnen diese Rechnungen, sich bemerkbar zu machen.
Die Preise für „Tokens“ – die Einheiten, mit denen die KI-Nutzung gemessen wird – sinken, doch die Kosten für die Erledigung einer Aufgabe steigen, da KI-Anbieter von Pauschalabonnements zu nutzungsabhängigen Preismodellen übergehen. Dies führt für Unternehmen zu unvorhersehbaren und oft höheren Rechnungen, da die Nutzung pro Aufgabe immer schwerer einzuschätzen ist.
Uber NYSE:UBER beispielsweise verbrauchte sein gesamtes KI-Budget für 2026 (link) in nur vier Monaten, nachdem Mitarbeiter eifrig KI-Programmierwerkzeuge einsetzten, was das Management laut Berichten (link) dazu zwang, die Nutzung zu begrenzen.
„Die WDHLG des Lizenzmodells hat viele Leute überrascht“, sagte Harold Byun, CEO von BlueRock, einem Start-up, das Unternehmen dabei unterstützt, KI-Systeme sicher zu betreiben. „Unmittelbar danach erhielten wir zahlreiche Meldungen von Kunden, dass sie einen Anstieg der Budgetüberschreitungen um 20 bis 30 Prozent verzeichnen.“
UNTERNEHMEN SORGEN SICH UM RIESIGE RECHNUNGEN
Da Unternehmen KI zunehmend einsetzen, steigen ihre Kosten über die ursprünglichen Schätzungen hinaus, da die Aufgaben nun mehr Schritte, mehr Daten und umfangreichere Eingaben erfordern.
Gartner schätzt, dass die Kosten für KI-Programmierung bis 2028 das durchschnittliche Entwicklergehalt übersteigen werden, während eine Umfrage des Marktforschungsunternehmens ergab, dass drei Viertel der Führungskräfte in diesem Jahr mit steigenden Technologiebudgets rechnen, wobei fast die Hälfte von ihnen zweistellige Zuwächse prognostiziert.
Dies hat Unternehmen dazu veranlasst, kostengünstigere Modelle zu nutzen und auf Routing-Tools wie OpenRouter, einen KI-Marktplatz, zurückzugreifen, um Aufgaben dem kosteneffizientesten System zuzuweisen und Premium-Modelle für komplexe Arbeiten wie die Programmierung zu reservieren.
Laut einer Mitteilung von Citi stieg der Anteil der auf OpenRouter verarbeiteten Open-Source-Token von 34 Prozent im Januar auf 65 Prozent im Juni.
Davon dürften Open-Source-Modellentwickler wie das chinesische Unternehmen DeepSeek profitieren, die bei Start-ups breite Akzeptanz gefunden haben, aber aufgrund von Sicherheitsbedenken Schwierigkeiten hatten, bei großen Unternehmen Fuß zu fassen.
„Wenn man den Unternehmensmarkt gewinnen will, sollte man Token im Voraus bepreisen“, schrieb Arora von Palo Alto Networks letzte Woche auf X und forderte KI-Labore dazu auf, Kunden bereits heute die niedrigeren Preise in Rechnung zu stellen, die Token voraussichtlich in einigen Jahren erzielen werden.
OpenAI scheint sich auf diesen Wandel einzustellen. Berichten zufolge erwägt der Hersteller von ChatGPT erhebliche Preissenkungen, unter anderem bei der Token-Nutzung, in Erwartung ähnlicher Schritte seitens des Konkurrenten Anthropic.
Allerdings könnte eine Umstellung auf günstigere Modelle das Umsatzwachstum beeinträchtigen, insbesondere angesichts der Vorbereitungen auf mögliche Börsengänge.
„Zwischen OpenAI und Anthropic wird es zu einer Art Preiskampf kommen, da beide um den ‚First-to-Public-Market‘-Börsengang wetteifern“, sagte Christopher Brown, Finanzberater im Bereich Private Wealth Management bei Synovus Securities, das Anteile an mehreren Big-Tech-Unternehmen hält.
Tech-Aktien verzeichneten über weite Teile der vergangenen Woche Kursverluste, da Investoren die Bewertungen von KI-Unternehmen neu bewerteten – Zweifel an der Rentabilität massiver Investitionen wurden durch die schwache Entwicklung von SpaceX nach dem Börsengang sowie durch Berichte verstärkt, dass OpenAI seinen Börsengang möglicherweise verschieben könnte.
OPEN SOURCE UND CHINESISCHE MODELLE ERHALTEN AUFMERKSAMKEIT
Der Kostenanstieg treibt immer mehr Unternehmen in Richtung Open-Source-Modelle, darunter auch kostengünstigere chinesische Alternativen. Die vier beliebtesten Modelle auf OpenRouter stammen alle aus China, wobei DeepSeek den Spitzenplatz einnimmt.
Chinesische Modelle schließen die Leistungslücke zu den führenden US-Modellen und kosten dabei nur 18 Cent pro Million Token, während die Top-Modelle im Durchschnitt 4 US-Dollar verlangen , wie aus der Citi-Analyse hervorgeht.
„ (-Open-Source-Modelle) lagen früher mehr als ein Jahr hinter (den führenden KI-Modellen) zurück. Nun gehen die Schätzungen davon aus, dass der Rückstand bei etwa vier Monaten liegt. Diese Lücke wird sich weiter schließen“, sagte Byun von BlueRock.
Dennoch äußerten einige Analysten die Ansicht, dass Bedenken hinsichtlich der Sicherheit chinesischer Modelle die Einführung in Unternehmen wahrscheinlich behindern würden, insbesondere in sensiblen Branchen wie der Cybersicherheit.
Stattdessen erwarten sie, dass Unternehmen dem Cloud-Computing-Modell folgen und sich auf mehrere Anbieter verteilen, um die beste Lösung und den besten Preis zu finden.
Open-Source-Modelle zeigen, dass sie „zu 90 Prozent genauso gut sind wie die teuren Modelle, kosten aber nur 10 Prozent des Preises“, sagte Val Bercovici, Chief AI Officer bei WEKA, einem Unternehmen, das Firmen dabei unterstützt, KI-Modelle schneller und kostengünstiger zu betreiben. „Wir müssen nicht auf jeder Ebene den höchsten Preis zahlen.“