全天候科技生成式AI

美團開源萬億參數大模型 LongCat-2.0,五萬卡國產算力全流程訓練

2026年7月1日 16:55
美團開源萬億參數大模型 LongCat-2.0,五萬卡國產算力全流程訓練

重點摘要

美團開源了萬億參數的大模型 LongCat-2.0,該模型採用五萬張國產算力卡進行全流程訓練。此模型特別強調 Agentic Coding 能力,即具備自主編碼與任務執行的特性。

站內 AI 整理稿

### 美團開源 LongCat-2.0 萬億參數模型:國產算力與 Agentic Coding 的新里程碑

中國科技巨頭美團近日宣布開源其最新的大型語言模型 LongCat-2.0,這款模型擁有萬億級別的參數規模,並且完全依賴五萬張國產 GPU 卡進行全流程訓練。這項消息不僅展示了美團在 AI 領域的技術實力,更凸顯了中國在自主算力生態系統上的突破。相較於過往依賴國外晶片(如 NVIDIA A100/H100)的訓練模式,LongCat-2.0 的出現意味著國產硬體已能夠支撐起超大規模模型的運算需求,對於 AI 產業的自主可控具有深遠意義。

根據現有資訊,LongCat-2.0 特別強調「Agentic Coding」能力。所謂 Agentic Coding,指的是模型能夠像智能代理(Agent)一樣,主動理解程式碼編寫的上下文,並自主完成複雜的邏輯推理與任務分解。這不僅僅是簡單的程式碼生成,而是讓模型具備類似人類工程師的「規劃—執行—除錯」能力。例如,當開發者提出一個完整的系統需求時,LongCat-2.0 可以自動拆解成多個子任務,設計資料流程、撰寫單元測試,甚至自行修復語法錯誤。這項特性對於加速軟體開發、降低新手門檻具有極大的潛力。

從背景脈絡來看,美團長期深耕本地生活服務,旗下涵蓋外送、到店、旅遊、交通等複雜業務場景。這些場景每天產生數以億計的訂單與調度需求,背後需要強大的演算法與工程團隊維護。透過開源 LongCat-2.0,美團一方面能吸引全球開發者社群參與改進模型,另一方面也能藉此驗證國產算力在真實生產環境中的穩定性。更重要的是,Agentic Coding 能力若能成功整合進美團的內部系統,例如自動生成外送路線規劃程式碼、自動維護後端服務,將大幅縮短研發週期,降低人力成本。

這款模型的問世可能對整個 AI 產業帶來多重影響。首先,對開源社群而言,萬億參數等級的模型過去多由 OpenAI、Google 等海外巨頭主導,現在由中國企業提供類似規模的開源方案,將加速全球 AI 民主化進程。其次,國產算力全流程訓練的成功經驗,可能推動中國雲端服務商(如阿里雲、華為雲)更積極地推廣國產 GPU 叢集解決方案,降低企業對進口晶片的依賴。此外,Agentic Coding 的興起也預示著「AI 工程師」角色的轉變——未來開發者可能更專注於高層次設計,而將重複性的編碼工作交由模型執行。

對於讀者而言,後續值得關注的關鍵面向包括:第一,LongCat-2.0 的開源授權條款為何?是否能商業使用?這將直接影響中小企業和獨立開發者的採用意願。第二,模型在真實程式碼除錯、軟體架構設計等標準測試集上的表現,是否真的能超越現有的 GPT-4、Claude 等封閉模型?第三,美團是否會發布專門的 Agent 框架來配合 LongCat-2.0,讓開發者能更輕鬆地建立自主編碼機器人?最後,國產算力的訓練效率與穩定性能否支撐萬億參數模型的持續迭代,也將是技術界觀察的重點。

整體而言,LongCat-2.0 的開源不僅是技術展演,更是一場關於「主權 AI」的戰略布局。隨著國產算力生態日趨成熟,未來我們可能會看到更多中國企業不只是在應用層面創新,而是從基礎模型訓練端就掌握核心能力。對於台灣的開發者與企業來說,這項進展也提供了一個新的對照組:當大陸已能自主訓練萬億參數模型時,台灣的 AI 發展策略或許需要重新思考在算力、演算法與開源社群之間的平衡點。建議持續關注 LongCat-2.0 的 GitHub 倉庫與技術論文,以掌握第一手效能評估資訊。

Related

相關文章

智東西生成式AI

時隔4個月,谷歌Nano Banana再發新模型

這篇消息聚焦「時隔4個月,谷歌Nano Banana再發新模型」。原始導語提到:4秒生成1K圖片,僅需0.23元。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛
智東西生成式AI

黃仁勳的物理AI ChatGPT時刻,正被這家中國公司的“流式多模態”接棒

智東西 作者 | 王涵 編輯 | 漠影 “物理AI的ChatGPT時刻已經到來。” 2026年1月5日,拉斯維加斯CES展會,英偉達創始人兼CEO黃仁勳宣告AI正式進入新階段。 在他看來,AI的演進可以分為四個階段:Perception AI、Generative AI、Agentic AI、Physical AI。當模型能夠理解質量、摩擦、慣性、動量守恆,AI才真正走出屏幕。他同時指出,要讓機器人理解物理世界,不能僅靠單一模型,而是需要建立一整套智能系統。 黃仁勳描繪了未來願景,但一個問題擺在了所有人面前——物理世界的AI,到底需要什麼樣的技術能力? AI真正走向物理世界,機器人、無人機、安防攝像頭、可穿戴設備這些場景,需要的不是回答問題,而是持續工作。物理AI最重要的,也就是主動執行的能力。 Om AI聯匯CEO兼首席科學家趙天成博士表示:“之前整個業內對通用視覺智能的關注度偏低,大家可能更關注一些可以看秀的表演或操作場景。但通用視覺這個點是未來物理AI真正規模化應用落地必不可少的,而且可能是更加現實、更加直接的核心技術,會更廣泛地應用到所有物理AI場景。” 通用視覺智能(General Vision Intelligence),即模型能像人一樣持續觀察環境、精準定位目標、自主驅動行動,且這一切必須在端側完成。 近日發佈的VLX端側流式多模態模型系列,正是這一路徑的最新實踐。 這是業界首次提出 “流式多模態” 這一全新模型架構。區別於傳統模型“採集-上傳-離線處理”的路徑,VLX系列面向物理世界中持續湧入的視頻流,實現毫秒級實時感知,並首次在端側打通“持續感知→精準定位→行動決策”的完整閉環。 一、三個模型、三層能力、一條鏈路 什麼是通用視覺智能(General Vision Intelligence)? Om AI聯匯的定義是三項核心能力:持續感知(無需人工觸發)、空

47 分鐘前

AI日報:谷歌推新圖片模型Nano Banana 2 Lite;Claude Sonnet 5 發佈;OpenClaw 正式推出 iOS 與 Android 移動版應用

歡迎來到【AI日報】欄目!這裡是你每天探索人工智能世界的指南,每天我們為你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。新鮮AI產品點擊瞭解:https://app.aibase.com/zh1、谷歌推出全新AI生圖模型NanoBanana2Lite:4秒出圖,主打高頻批量內容生產谷歌推出了全新的AI圖像與視頻生成模型NanoBanana2Lite,該模型在運行速度和成本效益方面都有顯著提升。其核心模型Kimi的價格調整不僅未影響需求,反帶來顯著收入增長,顯示出強大的市場競爭力。

2 小時前6100