美團龍貓LongCat大模型官方賬號周二公告稱,美團 HKEX:3690正式發布新一代萬億參數大模型LongCat-2.0,並將對外開源。
龍貓LongCat的公告指出,作為業界首個在五萬卡國產算力集群上完成全流程訓練與推理的萬億參數模型(總參數1.6T,平均激活約48 B,動態範圍33B~56B),LongCat-2.0從零開始預訓練,原生支持1M超長上下文。
其架構設計自始至終圍繞一個核心目標:讓模型在真實的Agentic Coding任務中,更高效、更穩定地完成代碼理解、生成與執行
正式版發布前, LongCat-2.0預覽版本已通過OpenRouter平台和longcat.ai面向全球開發者開放調用
截至目前該模型已躋身OpenRouter全球大模型調用量前三,月調用量在Hermes、Claude Code和OpenClaw分列全球第一、第二和第三位,成為最受全球Agent開發者歡迎的模型之一
三年來,團隊從千卡起步,逐步攻克算子適配、通信優化、分布式穩定性等基礎難題,最終在五萬卡集群上完成萬億參數模型的全流程訓練與推理
LongCat-2.0 預訓練數據規模超過30T tokens,覆蓋中文、英文、多語言和代碼等多類數據;面對萬卡級訓練中的硬件故障、通信異常、顯存壓力與數值波動,LongCat團隊從穩定性、正確性和效率三方面攻克國產算力訓練難題
最終,LongCat實現穩態日吞吐超過1T tokens/day,完成萬億參數 MoE 模型在國產算力上的穩定訓練
從穩定訓練到低延遲推理,LongCat-2.0驗證了其已具備在國產算力集群上進行大規模模型訓練的能力;它不只是“能訓出”萬億參數模型,還讓萬億參數模型能夠在真實任務中穩定運行 (完)