Ethan Wang/Eduardo Baptista
中国外卖巨头美团 HKEX:3690 周二表示,已发布并将开源其新一代“LongCat”大型语言模型,称这是全球首个完全在由国产处理器驱动的5万片芯片集群上训练和运行的万亿参数AI系统。
美团常被比作DoorDash,是进入中国这个竞争激烈且资金充裕的人工智能领域的后来者,其竞争对手包括DeepSeek和字节跳动的“斗宝”。LongCat团队成立于2023年,直到去年年底才推出其首个模型。
尽管该公司未透露新模型“LongCat-2.0”将如何融入现有业务,但美团此前已利用早期版本驱动应用内AI助手,提供餐厅和酒店推荐,并完成点餐、预订房间等任务——这正是竞争对手阿里巴巴 今年加速推进的“代理式电商”趋势的一部分。
在消费者信心疲软、利润率不断缩减的背景下,美团可能也在寻求多元化收入来源。在LongCat的官方微信账号发布的声明中,该公司重点强调了该模型构建游戏网站和创作小说的能力。
聚焦自主可控
LongCat-2.0对国产AI芯片的依赖,凸显了自给自足在中国国内AI市场中的日益重要性。自2022年华盛顿实施出口管制以来,DeepSeek、阿里巴巴 NYSE:BABA、字节跳动等主要企业都在努力减少对美国芯片的依赖,以训练其模型。
包括华为和恩弗莱姆在内的芯片制造商已迅速行动,填补了美国芯片制造商留下的空白,并通过与AI开发者的供货协议扩大了市场份额。
据声明称,LongCat-2.0使用5万颗国产芯片从零开始训练,可处理多达100万个令牌的输入,从而能够处理超长文档。
该模型专注于代理式编码,其架构设计旨在帮助其更高效、更可靠地处理现实世界的编码任务。
该公司表示,该模型的预览版已跻身全球知名AI市场OpenRouter上使用量前三的模型之列。
美团声称,在某些编码和智能体基准测试中,LongCat-2.0的表现与包括谷歌的Gemini、OpenAI的GPT-5.5以及Anthropic的Claude Opus在内的多款领先专有模型持平或更胜一筹。
这家中国科技巨头表示:“LongCat-2.0 证明,我们现在有能力在国内计算集群上训练大规模模型,”但未透露芯片制造商的名称。