Aditya Soni
对于希望为未来做好准备的企业而言,硅谷那些功能强大但价格高昂的AI模型一直是必不可少的。但如今,越来越多的科技公司CEO认为,更便宜的选择对于AI的广泛采用至关重要。
微软 NASDAQ:MSFT 的萨蒂亚·纳德拉(Satya Nadella)、Palo Alto Networks NASDAQ:PANW 的尼凯什·阿罗拉(Nikesh Arora)以及Coinbase Global NASDAQ:COIN 的布莱恩·阿姆斯特朗(Brian Armstrong)等高管均表示,规模更小、成本更低的模型足以满足企业的大部分需求。
这一观点源于企业内部的重新评估——直到最近,这些企业还鼓励大量使用AI工具,往往将不断增长的使用量视为生产力的代名词,这种现象被称为“tokenmaxxing” 。如今,这些账单开始给企业带来沉重负担。
作为衡量AI使用量的单位,“代币”价格正在下跌,但随着AI公司从固定订阅费模式转向按使用量计费,完成一项任务的成本却在上升。这使得企业面临难以预测且往往更高的账单,因为每项任务的使用量越来越难以估算。
例如,优步 NYSE:UBER 的员工争相采用AI编码工具,导致其2026年AI预算 (link) 在短短四个月内就被耗尽,迫使管理层对使用量设置上限,据报道 (link)。
“许可模式的变更让很多人措手不及,”帮助企业安全运行AI系统的初创公司BlueRock首席执行官哈罗德·拜恩(Harold Byun)表示。“此后不久,我们就收到许多客户反馈,称其预算超支情况激增了20%至30%。”
企业担忧巨额账单
随着企业越来越多地使用人工智能,相关成本正远超最初预估——因为任务现在涉及更多步骤、更多数据以及更长的输入过程。
Gartner预计,到2028年,AI编码成本将超过普通开发人员的平均薪资;该研究公司的一项调查还发现,四分之三的高管预计今年技术预算将增加,其中近半数预计增幅将达到两位数。
这促使企业采用更经济的模型,并转向OpenRouter等路由工具——OpenRouter是一个AI市场平台。企业希望将任务分配给最具成本效益的系统,同时将高端模型保留用于编码等复杂工作。
据花旗报告显示,在OpenRouter上处理的开源代币占比从1月的34%跃升至6月的65%。
这应将惠及中国DeepSeek等开源模型开发商——这些模型虽已在初创企业中得到广泛采用,但因安全顾虑而难以打入大型企业市场。
“若想赢得企业市场,就应提前设定代币定价,”Palo Alto Networks的阿罗拉上周在X平台发文写道,他敦促各AI实验室以代币预计在几年后才可能达到的较低费率,从现在开始向客户收费。
OpenAI似乎正在适应这一变化。据报道,这家ChatGPT开发商正考虑大幅降价,包括降低代币使用费,以应对竞争对手Anthropic可能采取的类似举措。
然而,转向更便宜的模型可能会损害其营收增长,尤其是在它们为潜在的首次公开募股(IPO)做准备之际。
“当OpenAI和Anthropic为‘率先公开上市’的IPO日期展开争夺时,将出现价格战的态势,”Synovus Securities私人财富管理部财务顾问克里斯托弗·布朗(Christopher Brown)表示,该公司持有数家科技巨头的股份。
上周大部分时间里,科技股 遭遇抛售,投资者正在重新评估人工智能领域的估值——对巨额支出回报的疑虑,加上SpaceX 上市后表现疲软,以及有报道称OpenAI可能推迟 上市,这些因素加剧了这种疑虑。
开源及中国模型备受关注
成本飙升正推动更多企业转向开源模型,包括更便宜的中国替代方案。OpenRouter上最受欢迎的四款模型均来自中国,其中DeepSeek位居榜首。
花旗报告显示,中国模型正在缩小与美国顶级模型的能力差距,且每百万代币的费用低至18美分,而顶级模型的平均费用为4美元。
“它们(开源模型) 过去曾落后于(领先的AI模型) 一年多。现在,据估计它们大概落后四个月。这一差距将继续缩小,”BlueRock的Byun表示。
尽管如此,一些分析师表示,对中国模型安全性的担忧可能会阻碍企业采用这些模型,特别是在网络安全等敏感行业。
相反,他们预计企业将遵循云计算的模式,在多家服务商之间进行分散部署,以寻找最合适且价格最优的方案。
WEKA公司首席AI官瓦尔·伯科维奇(Val Bercovici)表示,开源模型正证明其“以10%的价格就能达到90%的效果”。WEKA致力于帮助企业更快速、更经济地运行AI模型。“我们无需在每个层级的努力上都花费高价代币。”