Por Aditya Soni
Los potentes y costosos modelos de IA de Silicon Valley han sido una necesidad para las empresas que buscan prepararse para el futuro. Pero ahora, un número cada vez mayor de directores ejecutivos del sector tecnológico sostiene que las opciones más económicas serían cruciales para su adopción generalizada.
Altos ejecutivos como Satya Nadella, de Microsoft ( NASDAQ:MSFT), Nikesh Arora, de Palo Alto Networks ( NASDAQ:PANW), y Brian Armstrong, de Coinbase Global ( NASDAQ:COIN), han afirmado que los modelos más pequeños y económicos pueden cubrir una gran parte de las necesidades corporativas.
Esta opinión es el resultado de una reevaluación dentro de las empresas que, hasta hace poco, fomentaban un uso intensivo de las herramientas de IA, a menudo considerando el aumento del consumo como un indicador de la productividad, lo que se ha denominado «tokenmaxxing» . Ahora, esas facturas están empezando a pasar factura.
Los precios de los tokens —las unidades utilizadas para medir el uso de la IA— están bajando, pero el coste de completar una tarea está aumentando a medida que las empresas de IA pasan de las suscripciones fijas a los precios basados en el uso. Esto está dejando a las empresas con facturas impredecibles y, a menudo, más elevadas, ya que resulta cada vez más difícil estimar el uso por tarea.
Uber NYSE:UBER, por ejemplo, agotó todo su presupuesto de IA para 2026 (link) en solo cuatro meses después de que los empleados se apresuraran a adoptar herramientas de programación basadas en IA, lo que obligó a la dirección a limitar el uso, según informan (link).
«El cambio en el modelo de licencia pilló por sorpresa a mucha gente», afirmó Harold Byun, director ejecutivo de BlueRock, una startup que ayuda a las empresas a gestionar sistemas de IA de forma segura. «Inmediatamente después, recibimos varios informes de clientes que indicaban un aumento del 20 % al 30 % en los sobrecostes».
LAS EMPRESAS SE PREOCUPAN POR LAS ENORMES FACTURAS
A medida que las empresas utilizan cada vez más la IA, sus costes se disparan más allá de las estimaciones iniciales, ya que las tareas ahora implican más pasos, más datos y entradas más largas.
Gartner estima que los costes de programación de IA superarán el salario medio de un desarrollador para 2028, mientras que una encuesta realizada por la consultora reveló que tres cuartas partes de los ejecutivos prevén un aumento de los presupuestos tecnológicos este año, y casi la mitad de ellos prevé subidas de dos dígitos.
Esto ha llevado a las empresas a adoptar modelos más económicos y a recurrir a herramientas de enrutamiento como OpenRouter, un mercado de IA, en su intento por asignar tareas al sistema más rentable, reservando los modelos premium para trabajos complejos como la programación.
Los tokens de código abierto procesados en OpenRouter se dispararon hasta el 65 % en junio, frente al 34 % registrado en enero, según una nota de Citi.
Esto debería beneficiar a los creadores de modelos de código abierto, como la empresa china DeepSeek, que han logrado una amplia adopción entre las startups, pero han tenido dificultades para abrirse paso en las grandes empresas debido a preocupaciones de seguridad.
«Si quieres conquistar el mercado empresarial, debes fijar los precios de los tokens con antelación», escribió Arora, de Palo Alto Networks, en X la semana pasada, instando a los laboratorios de IA a cobrar a los clientes hoy mismo las tarifas más bajas que se espera que alcancen los tokens dentro de unos años.
OpenAI parece estar adaptándose a este cambio. Según se ha informado, el creador de ChatGPT está barajando importantes recortes de precios, incluso en el uso de tokens, en previsión de movimientos similares por parte de su rival Anthropic.
Sin embargo, cualquier cambio hacia modelos más baratos podría perjudicar el crecimiento de sus ingresos, especialmente ahora que se preparan para posibles salidas a bolsa.
«Se producirá una dinámica de guerra de precios entre OpenAI y Anthropic, ya que ambas se disputan la fecha de salida a bolsa para ser las primeras en llegar al mercado», afirmó Christopher Brown, asesor financiero en gestión de patrimonio privado de Synovus Securities, que posee acciones en varias empresas de las «Big Tech».
Las acciones tecnológicas sufrieron una venta masiva durante gran parte de la semana pasada, ya que los inversores reevaluaron las valoraciones de las empresas de IA, al verse agravadas las dudas sobre la rentabilidad de los enormes gastos por los débiles resultados posteriores a la salida a bolsa de SpaceX y los informes de que OpenAI podría retrasar su salida a bolsa.
LOS MODELOS DE CÓDIGO ABIERTO Y CHINOS LLAMAN LA ATENCIÓN
El aumento de los costes está empujando a más empresas hacia modelos de código abierto, incluidas alternativas chinas más baratas. Los cuatro modelos más populares en OpenRouter son todos chinos, con DeepSeek ocupando el primer puesto.
Los modelos chinos están reduciendo la brecha de capacidad con respecto a los principales modelos estadounidenses, al tiempo que cobran tan solo 18 céntimos por millón de tokens, frente a los 4 dólares de media que cobran los modelos líderes, según muestra el informe de Citi.
«(Los modelos de código abierto) solían llevar más de un año de retraso (respecto a los principales modelos de IA). Ahora, probablemente se estima que están unos cuatro meses por detrás. Esa brecha seguirá reduciéndose», afirmó Byun, de BlueRock.
Aun así, algunos analistas señalaron que las preocupaciones sobre la seguridad de los modelos chinos probablemente dificultarían su adopción por parte de las empresas, especialmente en sectores sensibles como la ciberseguridad.
En cambio, esperan que las empresas sigan el modelo de la computación en la nube, recurriendo a múltiples proveedores en busca de la mejor opción y el mejor precio.
Los modelos de código abierto están demostrando que son «un 90 % tan buenos como los demás a un 10 % del precio», afirmó Val Bercovici, director de IA de WEKA, empresa que ayuda a las empresas a ejecutar modelos de IA de forma más rápida y económica. «No necesitamos gastar los tokens premium en cada nivel de esfuerzo».