獨家內幕：美團如何用5萬張國產卡訓出“龍貓”萬億級模型？

2026年7月2日 07:10

重點摘要

美團近日揭露其最新萬億參數模型「LongCat-2.0（龍貓2.0）」，總參數量達1.6兆，採用MoE架構，每token啟動約480億參數。該模型完全依靠國產算力完成訓練與推理，峰值使用超過5萬張國產算力卡，為國內規模最大的全流程國產算力訓練任務，其原生Agent能力與程式效能已接近全球第一梯隊。

站內 AI 整理稿

根據您提供的文章內容，以下是對「獨家內幕：美團如何用5萬張國產卡訓出“龍貓”萬億級模型？」的摘要與分析，涵蓋5至8段，總字數超過500個中文字。美團近期發佈的LongCat-2.0（龍貓2.0）模型，是一款總參數量達1.6萬億、每token激活約480億參數的MoE大語言模型。該模型以「Owl Alpha」的代號匿名上線OpenRouter平台，迅速在Hermes、Claude Code等Agent模型中霸榜，調用量長期位居全球前三，成為業界矚目的黑馬。更關鍵的是，LongCat-2.0是國內首個完全依賴國產算力完成訓練與推理的萬億參數模型，峰值訓練規模超過5萬張國產卡，標誌著國產算力在支撐世界級大模型訓練上取得了突破性進展。三年前，美團龍貓團隊在ChatGPT引發的算力搶購潮中，面對A100一卡難求的困境，開始認真討論使用國產算力進行大模型訓練的可能性。雖然當時行業普遍認為國產卡只能做推理，但團隊分析後認為，大模型訓練並非玄學，而是複雜的系統工程，只要硬件精度無誤，就不存在原理性障礙。這一「頭鐵」的決定快速獲得了公司支持，團隊從基座模型建設起步，同步佈局國產算力，展現出敢於挑戰不可能的決心。從2023年7月啟動國產算力適配，到2024春節前後首次跑通端到端訓練，再到2024年7月交付超過16000卡的集群，團隊經歷了清晰的漸進擴容路徑。從2560卡到5萬卡，每跨越一個數量級都面臨意想不到的挑戰，例如萬卡集群啟動時調度系統因內存超出整數上限而無法運行，以及大規模訓練中出現的「比特翻轉」問題。這些在小規模訓練中從未出現的物理現象，要求團隊建立自動感知和恢復機制，最終實現92%以上的訓練穩定性。面對國產算力生態不成熟的困境，LongCat團隊幾乎重寫了整套基礎設施，從核心算子、通信框架到調度系統和訓練工具鏈，都進行了自研適配。例如，在FlashAttention反向梯度算子開發中，原有實現性能損失達20到70倍，團隊自研了高性能確定性算子，將性能損失控制在5%左右。這些底層工作不僅實現了「整網確定性訓練」，使計算結果可精確復現，還意外發現國產芯片在部分算子上的計算誤差甚至低於主流芯片，打破了「國產卡誤差大」的固有偏見。模型能力的驗證同樣令人振奮。LongCat-2.0在SWE-bench Pro得分59.5，超過Gemini 3.1 Pro；在Terminal-Bench 2.1得分70.8，展現出穩定執行與糾錯能力。綜合來看，其在編程和通用Agent場景中已接近全球第一梯隊水平。智東西的實測也顯示，該模型在邏輯推理和複雜程式碼生成上表現優異，且受益於Cache命中免費策略，Token消耗速度遠低於同

原始來源：智東西 ↗

查看原始來源

36氪生成式AI

Claude Fable 5，名存實亡

assistant: 根據提供的內容，這似乎是一則關於AI模型服務的報導或評論。摘要如下：Claude的Fable 5模型在更新後性能大幅下滑，跑分結果出現斷崖式下跌。官方文檔揭露，用戶在付費使用Fable 5的過程中，實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。</think>Claude的Fable 5模型在更新後性能大幅下滑，跑分結果出現斷崖式下跌。官方文檔揭露，用戶在付費使用Fable 5的過程中，實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。

剛剛閱讀分析

智東西生成式AI

對話Kimi B端負責人黃震昕：把國產大模型搬上亞馬遜雲科技，未來與海外“御三家”掰手腕

月之暗面Kimi與亞馬遜雲科技展開四層合作，涵蓋基礎設施、平台服務、業務合作及垂直行業，藉此拓展全球市場。Kimi B端負責人黃震昕透露，公司提供業界最高人均算力，B端業務快速增長，並在Token效率、長程推理及Agent集群等方面取得技術突破，目標是與海外頂尖模型競爭。他預測，雖然算力成本上漲推升模型價格，但技術優化將持續提升性價比。

5 小時前閱讀分析

雷峰網生成式AI

算力之外的博弈：ICML 2026 透露了哪些學術硬通貨？

告別盲目刷榜，28頁 PPT 帶你摸透 ICML 新風向。作者丨陳淑瑜編輯丨岑峰 ICML 2026 的投稿量從去年的 12107 篇直接飆升至 23,918 篇，幾近翻倍。然而，最終的接收率卻牢牢釘在 26.56%，與去年幾乎持平。這一數據傳遞出一個明確的信號：並非競爭變得盲目激烈，而是學術評審標準經歷了一次深刻的“重新校準”。

6 小時前閱讀分析

智東西生成式AI

獨家：阿里全面禁用Claude

智東西作者 | 李水青編輯 | 雲鵬智東西7月3日獨家獲悉，今日，阿里巴巴內部宣佈反向禁用Claude。阿里全員被要求卸載Anthropic相關產品，包括Sonnet、Opus、Fable等多個系列模型，以及Claude Code在內的Agent產品。禁令於7月10日正式生效。

8 小時前閱讀分析

智東西生成式AI

超190億！AI視頻最大單筆融資誕生，阿里騰訊百度都投了

快手旗下AI視頻生成業務「可靈AI」完成190.48億元融資，阿里、騰訊、百度均參與投資，快手持股比例降至約68.33%。可靈AI自2024年6月上線以來已更新30多次，2025年營收約11億元，年化收入運行率達5億美元。快手同時宣布首次授予員工股權獎勵，並計劃在未來12個月內推動可靈AI赴港上市。

11 小時前閱讀分析

MarkTechPost AI生成式AI

RAG-Anything 教學：在 Colab 中建立支援文字、表格、方程式與圖像的多模態檢索管道

本教學示範如何在 Google Colab 中建立 RAG-Anything 多模態檢索管道，支援文字、表格、方程式與圖像。流程包括安裝依賴、設定 OpenAI API、建立合成多模態報告與 PDF，並測試 naive、local、global 與 hybrid 等不同檢索模式。最終實現從內容列表格式插入資料，並透過多模態嵌入與視覺功能進行靈活檢索。

15 小時前閱讀分析

相關文章

Claude Fable 5，名存實亡

對話Kimi B端負責人黃震昕：把國產大模型搬上亞馬遜雲科技，未來與海外“御三家”掰手腕

算力之外的博弈：ICML 2026 透露了哪些學術硬通貨？

獨家：阿里全面禁用Claude

超190億！AI視頻最大單筆融資誕生，阿里騰訊百度都投了

RAG-Anything 教學：在 Colab 中建立支援文字、表格、方程式與圖像的多模態檢索管道