Who published this market news?

Reuters published this market news item.

Which market symbols are mentioned?

NASDAQ:AMZN, NASDAQ:COIN, NASDAQ:META, NASDAQ:MSFT, NASDAQ:PANW, NYSE:UBER

更便宜的AI更胜一筹：飙升的成本正在重塑企业选择模型的方式

Aditya Soni对于希望为未来做好准备的企业而言，硅谷那些功能强大但价格高昂的AI模型一直是必不可少的。但如今，越来越多的科技公司CEO认为，更便宜的选择对于AI的广泛采用至关重要。微软 NASDAQ:MSFT 的萨蒂亚·纳德拉（Satya Nadella）、Palo Alto Networks NASDAQ:PANW 的尼凯什·阿罗拉（Nikesh Arora）以及Coinbase Global NASDAQ:COIN 的布莱恩·阿姆斯特朗（Brian Armstrong）等高管均表示，规模更小、成本更低的模型足以满足企业的大部分需求。这一观点源于企业内部的重新评估——直到最近，这些…

Aditya Soni

对于希望为未来做好准备的企业而言，硅谷那些功能强大但价格高昂的AI模型一直是必不可少的。但如今，越来越多的科技公司CEO认为，更便宜的选择对于AI的广泛采用至关重要。

微软 NASDAQ:MSFT 的萨蒂亚·纳德拉（Satya Nadella）、Palo Alto Networks NASDAQ:PANW 的尼凯什·阿罗拉（Nikesh Arora）以及Coinbase Global NASDAQ:COIN 的布莱恩·阿姆斯特朗（Brian Armstrong）等高管均表示，规模更小、成本更低的模型足以满足企业的大部分需求。

这一观点源于企业内部的重新评估——直到最近，这些企业还鼓励大量使用AI工具，往往将不断增长的使用量视为生产力的代名词，这种现象被称为“tokenmaxxing” 。如今，这些账单开始给企业带来沉重负担。

作为衡量AI使用量的单位，“代币”价格正在下跌，但随着AI公司从固定订阅费模式转向按使用量计费，完成一项任务的成本却在上升。这使得企业面临难以预测且往往更高的账单，因为每项任务的使用量越来越难以估算。

例如，优步 NYSE:UBER 的员工争相采用AI编码工具，导致其2026年AI预算 (link) 在短短四个月内就被耗尽，迫使管理层对使用量设置上限，据报道 (link)。

“许可模式的变更让很多人措手不及，”帮助企业安全运行AI系统的初创公司BlueRock首席执行官哈罗德·拜恩（Harold Byun）表示。“此后不久，我们就收到许多客户反馈，称其预算超支情况激增了20%至30%。”

企业担忧巨额账单

随着企业越来越多地使用人工智能，相关成本正远超最初预估——因为任务现在涉及更多步骤、更多数据以及更长的输入过程。

Gartner预计，到2028年，AI编码成本将超过普通开发人员的平均薪资；该研究公司的一项调查还发现，四分之三的高管预计今年技术预算将增加，其中近半数预计增幅将达到两位数。

这促使企业采用更经济的模型，并转向OpenRouter等路由工具——OpenRouter是一个AI市场平台。企业希望将任务分配给最具成本效益的系统，同时将高端模型保留用于编码等复杂工作。

据花旗报告显示，在OpenRouter上处理的开源代币占比从1月的34%跃升至6月的65%。

这应将惠及中国DeepSeek等开源模型开发商——这些模型虽已在初创企业中得到广泛采用，但因安全顾虑而难以打入大型企业市场。

“若想赢得企业市场，就应提前设定代币定价，”Palo Alto Networks的阿罗拉上周在X平台发文写道，他敦促各AI实验室以代币预计在几年后才可能达到的较低费率，从现在开始向客户收费。

OpenAI似乎正在适应这一变化。据报道，这家ChatGPT开发商正考虑大幅降价，包括降低代币使用费，以应对竞争对手Anthropic可能采取的类似举措。

然而，转向更便宜的模型可能会损害其营收增长，尤其是在它们为潜在的首次公开募股（IPO）做准备之际。

“当OpenAI和Anthropic为‘率先公开上市’的IPO日期展开争夺时，将出现价格战的态势，”Synovus Securities私人财富管理部财务顾问克里斯托弗·布朗（Christopher Brown）表示，该公司持有数家科技巨头的股份。

上周大部分时间里，科技股遭遇抛售，投资者正在重新评估人工智能领域的估值——对巨额支出回报的疑虑，加上SpaceX 上市后表现疲软，以及有报道称OpenAI可能推迟上市，这些因素加剧了这种疑虑。

开源及中国模型备受关注

成本飙升正推动更多企业转向开源模型，包括更便宜的中国替代方案。OpenRouter上最受欢迎的四款模型均来自中国，其中DeepSeek位居榜首。

花旗报告显示，中国模型正在缩小与美国顶级模型的能力差距，且每百万代币的费用低至18美分，而顶级模型的平均费用为4美元。

“它们(开源模型) 过去曾落后于(领先的AI模型) 一年多。现在，据估计它们大概落后四个月。这一差距将继续缩小，”BlueRock的Byun表示。

尽管如此，一些分析师表示，对中国模型安全性的担忧可能会阻碍企业采用这些模型，特别是在网络安全等敏感行业。

相反，他们预计企业将遵循云计算的模式，在多家服务商之间进行分散部署，以寻找最合适且价格最优的方案。

WEKA公司首席AI官瓦尔·伯科维奇（Val Bercovici）表示，开源模型正证明其“以10%的价格就能达到90%的效果”。WEKA致力于帮助企业更快速、更经济地运行AI模型。“我们无需在每个层级的努力上都花费高价代币。”