獨家內幕:美團如何用5萬張國產卡訓出“龍貓”萬億級模型?
重點摘要
美團近日揭露其最新萬億參數模型「LongCat-2.0(龍貓2.0)」,總參數量達1.6兆,採用MoE架構,每token啟動約480億參數。該模型完全依靠國產算力完成訓練與推理,峰值使用超過5萬張國產算力卡,為國內規模最大的全流程國產算力訓練任務,其原生Agent能力與程式效能已接近全球第一梯隊。
根據您提供的文章內容,以下是對「獨家內幕:美團如何用5萬張國產卡訓出“龍貓”萬億級模型?」的摘要與分析,涵蓋5至8段,總字數超過500個中文字。 美團近期發佈的LongCat-2.0(龍貓2.0)模型,是一款總參數量達1.6萬億、每token激活約480億參數的MoE大語言模型。該模型以「Owl Alpha」的代號匿名上線OpenRouter平台,迅速在Hermes、Claude Code等Agent模型中霸榜,調用量長期位居全球前三,成為業界矚目的黑馬。更關鍵的是,LongCat-2.0是國內首個完全依賴國產算力完成訓練與推理的萬億參數模型,峰值訓練規模超過5萬張國產卡,標誌著國產算力在支撐世界級大模型訓練上取得了突破性進展。 三年前,美團龍貓團隊在ChatGPT引發的算力搶購潮中,面對A100一卡難求的困境,開始認真討論使用國產算力進行大模型訓練的可能性。雖然當時行業普遍認為國產卡只能做推理,但團隊分析後認為,大模型訓練並非玄學,而是複雜的系統工程,只要硬件精度無誤,就不存在原理性障礙。這一「頭鐵」的決定快速獲得了公司支持,團隊從基座模型建設起步,同步佈局國產算力,展現出敢於挑戰不可能的決心。 從2023年7月啟動國產算力適配,到2024春節前後首次跑通端到端訓練,再到2024年7月交付超過16000卡的集群,團隊經歷了清晰的漸進擴容路徑。從2560卡到5萬卡,每跨越一個數量級都面臨意想不到的挑戰,例如萬卡集群啟動時調度系統因內存超出整數上限而無法運行,以及大規模訓練中出現的「比特翻轉」問題。這些在小規模訓練中從未出現的物理現象,要求團隊建立自動感知和恢復機制,最終實現92%以上的訓練穩定性。 面對國產算力生態不成熟的困境,LongCat團隊幾乎重寫了整套基礎設施,從核心算子、通信框架到調度系統和訓練工具鏈,都進行了自研適配。例如,在FlashAttention反向梯度算子開發中,原有實現性能損失達20到70倍,團隊自研了高性能確定性算子,將性能損失控制在5%左右。這些底層工作不僅實現了「整網確定性訓練」,使計算結果可精確復現,還意外發現國產芯片在部分算子上的計算誤差甚至低於主流芯片,打破了「國產卡誤差大」的固有偏見。 模型能力的驗證同樣令人振奮。LongCat-2.0在SWE-bench Pro得分59.5,超過Gemini 3.1 Pro;在Terminal-Bench 2.1得分70.8,展現出穩定執行與糾錯能力。綜合來看,其在編程和通用Agent場景中已接近全球第一梯隊水平。智東西的實測也顯示,該模型在邏輯推理和複雜程式碼生成上表現優異,且受益於Cache命中免費策略,Token消耗速度遠低於同
Related
相關文章

Claude Fable 5,名存實亡
assistant: 根據提供的內容,這似乎是一則關於AI模型服務的報導或評論。摘要如下:Claude的Fable 5模型在更新後性能大幅下滑,跑分結果出現斷崖式下跌。官方文檔揭露,用戶在付費使用Fable 5的過程中,實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。</think>Claude的Fable 5模型在更新後性能大幅下滑,跑分結果出現斷崖式下跌。官方文檔揭露,用戶在付費使用Fable 5的過程中,實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。
對話Kimi B端負責人黃震昕:把國產大模型搬上亞馬遜雲科技,未來與海外“御三家”掰手腕
月之暗面Kimi與亞馬遜雲科技展開四層合作,涵蓋基礎設施、平台服務、業務合作及垂直行業,藉此拓展全球市場。Kimi B端負責人黃震昕透露,公司提供業界最高人均算力,B端業務快速增長,並在Token效率、長程推理及Agent集群等方面取得技術突破,目標是與海外頂尖模型競爭。他預測,雖然算力成本上漲推升模型價格,但技術優化將持續提升性價比。
算力之外的博弈:ICML 2026 透露了哪些學術硬通貨?
告別盲目刷榜,28頁 PPT 帶你摸透 ICML 新風向。 作者丨陳淑瑜 編輯丨岑峰 ICML 2026 的投稿量從去年的 12107 篇直接飆升至 23,918 篇,幾近翻倍。然而,最終的接收率卻牢牢釘在 26.56%,與去年幾乎持平。這一數據傳遞出一個明確的信號:並非競爭變得盲目激烈,而是學術評審標準經歷了一次深刻的“重新校準”。
獨家:阿里全面禁用Claude
智東西 作者 | 李水青 編輯 | 雲鵬 智東西7月3日獨家獲悉,今日,阿里巴巴內部宣佈反向禁用Claude。阿里全員被要求卸載Anthropic相關產品,包括Sonnet、Opus、Fable等多個系列模型,以及Claude Code在內的Agent產品。禁令於7月10日正式生效。
超190億!AI視頻最大單筆融資誕生,阿里騰訊百度都投了
快手旗下AI視頻生成業務「可靈AI」完成190.48億元融資,阿里、騰訊、百度均參與投資,快手持股比例降至約68.33%。可靈AI自2024年6月上線以來已更新30多次,2025年營收約11億元,年化收入運行率達5億美元。快手同時宣布首次授予員工股權獎勵,並計劃在未來12個月內推動可靈AI赴港上市。
RAG-Anything 教學:在 Colab 中建立支援文字、表格、方程式與圖像的多模態檢索管道
本教學示範如何在 Google Colab 中建立 RAG-Anything 多模態檢索管道,支援文字、表格、方程式與圖像。流程包括安裝依賴、設定 OpenAI API、建立合成多模態報告與 PDF,並測試 naive、local、global 與 hybrid 等不同檢索模式。最終實現從內容列表格式插入資料,並透過多模態嵌入與視覺功能進行靈活檢索。