業界首個:美團 LongCat-2.0 發佈,國產芯片上跑出的萬億參數模型

重點摘要
LongCat-2.0 宣稱是業界首個在五萬卡國產算力集群上完成全流程訓練與推理的萬億參數模型(總參數 1.6 T,平均激活約 48 B,動態範圍 33B~56B),從零開始預訓練,原生支持 1M 超長上下文。
### 重點整理:LongCat-2.0 的技術亮點
中國科技巨頭美團近日正式發布 LongCat-2.0,號稱是業界首個完全基於五萬卡國產算力集群、從零開始預訓練的萬億參數大語言模型。該模型總參數規模達到 1.6 兆(T),但採用混合專家(MoE)架構,實際運行時平均只激活約 48B 參數,且動態範圍在 33B 至 56B 之間,兼顧了效能與運算效率。此外,LongCat-2.0 原生支援長達 1 百萬 token 的超長上下文,使其在處理長文件、對話歷史或複雜推理任務時具備顯著優勢。這項發展不僅代表美團在 AI 基礎模型領域的技術突破,也凸顯國產晶片在大規模訓練場景下的可行性。
### 背景脈絡:國產算力與大模型競賽
過去一年,全球 AI 產業進入「萬億參數」軍備競賽,但多數頂尖模型仍依賴 NVIDIA 等國際晶片廠商的算力。在出口管制與地緣政治影響下,中國企業積極尋求國產替代方案。美團此次使用五萬張國產加速卡完成訓練與推理,證明國產晶片已能支撐超大規模模型的全流程開發。LongCat-2.0 的發布也呼應了中國政府推動「自主可控」算力基礎設施的政策方向,並與百度、阿里、華為等競業的國產模型形成對比——後者多採用混合晶片或部分國產方案。美團選擇完全國產化,背後可能與其在餐飲、物流、即時配送等場景對資料安全與低延遲的需求有關。
### 可能影響:國產晶片生態與美團業務的雙重催化
從產業層面來看,LongCat-2.0 成功在國產算力集群上跑通,將激勵更多晶片廠商(如寒武紀、海光、昇騰等)優化其軟體棧與互聯能力,加速國產 AI 基礎設施的成熟。對美團而言,這款模型可應用於智慧客服、即時物流路線規劃、商戶推薦、無人配送感知等多項核心業務。尤其原生支援 1M 超長上下文,有利於處理複雜的訂單歷程、使用者行為鏈或監管文件,提升決策精準度。此外,若美團後續開放模型或提供 API,可能改變國內中小企業獲取頂尖 AI 能力的門檻,進一步擴張美團的生態影響力。
### 讀者可關注的後續:性能評測與應用落地
目前 LongCat-2.0 的公開資訊有限,外界最關心的莫過於其真實性能。未來幾個月,美團是否會公布標準基準測試(如 MMLU、GSM8K、長文本理解等)的數據,將是評估模型競爭力的關鍵。此外,模型是否會開源或允許商業授權,也將影響開發者社群的反應。讀者可以關注美團在技術部落格或學術會議上發布的技術報告,深入了解其架構設計與訓練策略。另一個觀察重點是:美團是否會率先將 LongCat-2.0 整合進旗下 App(如美團外賣、大眾點評),並對使用者體驗帶來實際改變。
### 業界反應與潛在挑戰
雖然 LongCat-2.0 的發布令人振奮,但業界對於國產晶片面臨的功耗、穩定性與軟體生態問題仍持審慎態度。五萬卡集群的規模在國內尚屬罕見,其訓練成本與運維難度不容小覷。此外,萬億參數模型的推理延遲與記憶體佔用,能否在即時場景中達到商用門檻,仍需實際測試。美團過去在自動配送與智慧排程領域有深厚積累,但大模型與業務系統的深度融合,通常需要長期的調校與迭代。因此,讀者在關注技術突破之餘,也應留意美團是否提出具體的落地時間表與成本效益分析。
### 總結:國產大模型的新里程碑
LongCat-2.0 的出現,標誌著中國在「全鏈路國產算力」與「萬億參數級模型」兩個維度同時取得進展。它不僅回應了外界對國產晶片能否撐起頂尖 AI 模型的質疑,也為美團在 AI 時代的競爭增添了重要籌碼。隨著更多企業跟進純國產方案,未來可能出現一波「去 NVIDIA 化」的大模型訓練浪潮。對一般使用者而言,這場技術競賽的最終紅利,可能體現在更聰明的外賣推薦、更即時的配送預測,以及更流暢的語音助理體驗上。我們將持續追蹤 LongCat-2.0 的後續動態。
Related
相關文章

退錢,Claude 4.8連夜大降智,GPT-5.6算力遭“腰斬”
最近,AI社區遭遇集體降智潮!OpenAI疑似暗中開啟GPT-5.6灰度測試,神秘「Juice」測試引爆全網查成分;另一邊,Anthropic的Claude Opus 4.8被曝斷崖式降智,疑似被切腦。我們花錢買到的AI,究竟是什麼版本?

馬斯克抽調 SpaceX 頂尖星艦和星鏈工程師,全力攻堅 Grok 大模型
馬斯克將數十名 SpaceX 星鏈與星艦核心工程師調至 AI 團隊,全力迭代 Grok 大模型。最新版 Grok 4.5 已開始內部測試,SpaceX 計劃每月推出一款全新訓練的大模型。這標誌著 SpaceX 在完成 850 億美元 IPO 後,正利用鉅額資金和工程資源全面押注人工智能賽道。#SpaceX##人工智能##馬斯克#

GLM-5.3你來定!智譜唐傑全球徵集意見,評論區清一色:視覺
這篇消息聚焦「GLM-5.3你來定!智譜唐傑全球徵集意見,評論區清一色:視覺」。原始導語提到:真·有求必應·阿拉丁 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

920 億參數,華為 openPangu-2.0-Flash 模型正式開源上線
openPangu-2.0 模型相關組件,將於 6 月 30 日起陸續開源:openPangu-2.0-Flash 模型權重、基礎推理代碼、訓推算子,6 月 30 日正式上線開源平臺。openPangu-2.0-Pro 模型權重、基礎推理代碼,將於 7 月上線開源平臺。
花99萬,買個機器人男友談戀愛
智東西 作者 | 許麗思 編輯|漠影 智東西6月30日深圳現場報道,今天,優必選正式發佈了首款全尺寸超仿生人形機器人U1系列。其首批產品包括女版機器人小優Una和男版機器人凌夜Nix。 U1 最出彩的地方,一是面部表情非常逼真,二是全身動作也挺流暢絲滑,能和人類舞者搭檔跳《愛樂之城》,整套舞蹈的動作、節奏都把握得不錯。 ▲現場展出的U1,能夠模擬多種人類表情 ▲舞臺上,女版U1Ultra與人類共舞 U1系列共有三款產品:U1Lite是輕量化半身版,方便攜帶、搬運,價格為11.98萬元;高配全身版U1Pro為16.98萬元;高動態全身版U1Ultra女版為88萬元,男版貴一些,為99萬元。 U1 Ultra 男女款差價高達11 萬,差不多都能買一輛車了。 U1系列主打高顏值,僅限成年人購買,它可以情緒陪伴、日常互動,還能在陪伴過程中越用越懂你。不過,對於不少用戶好奇的能不能買回家順便完成做飯、打掃衛生、收納等家務活,優必選明確表示:那還不行。 優必選創始人、董事會主席兼CEO周劍現場說,上臺前,他剛得知訂單突破11000臺;而在半個小時後,優必選首席品牌官、機器人大消費創新事業部總裁、優世界總經理譚旻提到,這個數據又刷新到超13361臺。 用戶支付3000定金即可訂購,在7月15日預售結束前可退。截至目前,在京東平臺上,可以看到U1已定5467件,天貓平臺已定80件。 按照計劃,優必選將於9月16日啟動量產交付,2026年全年目標交付1萬臺以上。 發佈會現場打造了一個4000㎡沉浸式人機共生藝術空間,展示了U1的多個不同應用場景,包括醫康養評估接待,家庭情感陪伴、青少年心理療愈、前臺迎賓接待等。 比如在前臺迎賓接待的場景中,化身接待員的U1可以給觀眾自我介紹、講講優必選的發展、不同的產品線,可以說是有問必答。 不過,從現場體驗來看,U1有時需要等待片刻才能作出回答,語音與唇形
AI日報:美團發佈LongCat-2.0;小紅書 RedKnot 推理引擎開源;豆包App內置地圖導航
歡迎來到【AI日報】欄目!這裡是你每天探索人工智能世界的指南,每天我們為你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。新鮮AI產品點擊瞭解:https://app.aibase.com/zh1、美團正式發佈萬億參數開源大模型LongCat-2.0,原生支持1M超長上下文美團正式發佈並開源了新一代萬億參數大模型LongCat-2.0,該模型在國產算力集群上完成全流程訓練與推理,擁有1.6T總參數,並原生支持1M超長上下文。8、華為openPangu2.0雙版本亮相:加速Agent時代算力與生態雙向突圍華為正式宣佈開源盤古大模型920億參數的openPangu-2.0-Flash模型權重、基礎推理代碼及訓推算子,旨在加速人工智能的商業創新,打造Agent時代的智能底座並繁榮昇騰開發者生態。