美團開源萬億參數大模型 LongCat-2.0，五萬卡國產算力全流程訓練

2026年7月1日 16:55

重點摘要

美團開源了萬億參數的大模型 LongCat-2.0，該模型採用五萬張國產算力卡進行全流程訓練。此模型特別強調 Agentic Coding 能力，即具備自主編碼與任務執行的特性。

站內 AI 整理稿

### 美團開源 LongCat-2.0 萬億參數模型：國產算力與 Agentic Coding 的新里程碑

中國科技巨頭美團近日宣布開源其最新的大型語言模型 LongCat-2.0，這款模型擁有萬億級別的參數規模，並且完全依賴五萬張國產 GPU 卡進行全流程訓練。這項消息不僅展示了美團在 AI 領域的技術實力，更凸顯了中國在自主算力生態系統上的突破。相較於過往依賴國外晶片（如 NVIDIA A100/H100）的訓練模式，LongCat-2.0 的出現意味著國產硬體已能夠支撐起超大規模模型的運算需求，對於 AI 產業的自主可控具有深遠意義。

根據現有資訊，LongCat-2.0 特別強調「Agentic Coding」能力。所謂 Agentic Coding，指的是模型能夠像智能代理（Agent）一樣，主動理解程式碼編寫的上下文，並自主完成複雜的邏輯推理與任務分解。這不僅僅是簡單的程式碼生成，而是讓模型具備類似人類工程師的「規劃—執行—除錯」能力。例如，當開發者提出一個完整的系統需求時，LongCat-2.0 可以自動拆解成多個子任務，設計資料流程、撰寫單元測試，甚至自行修復語法錯誤。這項特性對於加速軟體開發、降低新手門檻具有極大的潛力。

從背景脈絡來看，美團長期深耕本地生活服務，旗下涵蓋外送、到店、旅遊、交通等複雜業務場景。這些場景每天產生數以億計的訂單與調度需求，背後需要強大的演算法與工程團隊維護。透過開源 LongCat-2.0，美團一方面能吸引全球開發者社群參與改進模型，另一方面也能藉此驗證國產算力在真實生產環境中的穩定性。更重要的是，Agentic Coding 能力若能成功整合進美團的內部系統，例如自動生成外送路線規劃程式碼、自動維護後端服務，將大幅縮短研發週期，降低人力成本。

這款模型的問世可能對整個 AI 產業帶來多重影響。首先，對開源社群而言，萬億參數等級的模型過去多由 OpenAI、Google 等海外巨頭主導，現在由中國企業提供類似規模的開源方案，將加速全球 AI 民主化進程。其次，國產算力全流程訓練的成功經驗，可能推動中國雲端服務商（如阿里雲、華為雲）更積極地推廣國產 GPU 叢集解決方案，降低企業對進口晶片的依賴。此外，Agentic Coding 的興起也預示著「AI 工程師」角色的轉變——未來開發者可能更專注於高層次設計，而將重複性的編碼工作交由模型執行。

對於讀者而言，後續值得關注的關鍵面向包括：第一，LongCat-2.0 的開源授權條款為何？是否能商業使用？這將直接影響中小企業和獨立開發者的採用意願。第二，模型在真實程式碼除錯、軟體架構設計等標準測試集上的表現，是否真的能超越現有的 GPT-4、Claude 等封閉模型？第三，美團是否會發布專門的 Agent 框架來配合 LongCat-2.0，讓開發者能更輕鬆地建立自主編碼機器人？最後，國產算力的訓練效率與穩定性能否支撐萬億參數模型的持續迭代，也將是技術界觀察的重點。

整體而言，LongCat-2.0 的開源不僅是技術展演，更是一場關於「主權 AI」的戰略布局。隨著國產算力生態日趨成熟，未來我們可能會看到更多中國企業不只是在應用層面創新，而是從基礎模型訓練端就掌握核心能力。對於台灣的開發者與企業來說，這項進展也提供了一個新的對照組：當大陸已能自主訓練萬億參數模型時，台灣的 AI 發展策略或許需要重新思考在算力、演算法與開源社群之間的平衡點。建議持續關注 LongCat-2.0 的 GitHub 倉庫與技術論文，以掌握第一手效能評估資訊。

原始來源：全天候科技 ↗

查看原始來源

36氪生成式AI

谷歌貼身對標字節：最新輕量版 Nano Banana 2 四秒出圖，單張僅 0.034 美元，還能直出視頻

谷歌最新發布輕量版 Nano Banana 2，能在四秒內生成圖片，單張成本僅 0.034 美元，價格低於字節跳動的競品。該模型在出圖品質與延遲上實現雙重反超，並具備直接生成影片的功能。

剛剛閱讀分析

智東西生成式AI

時隔4個月，谷歌Nano Banana再發新模型

這篇消息聚焦「時隔4個月，谷歌Nano Banana再發新模型」。原始導語提到：4秒生成1K圖片，僅需0.23元。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

IT之家生成式AI

OpenAI：ChatGPT 全球採用率持續擴大，非英語用戶佔比過半

OpenAI 最新報告顯示，ChatGPT 全球採用率持續擴大，非英語用戶佔比已超過一半。用戶地域分佈更廣，非洲和亞洲增速最快，35 歲以上用戶群體也在擴大。工作用途中，視覺設計任務增長最快。#ChatGPT##AI#

剛剛閱讀分析

智東西生成式AI

黃仁勳的物理AI ChatGPT時刻，正被這家中國公司的“流式多模態”接棒

智東西作者 | 王涵編輯 | 漠影 “物理AI的ChatGPT時刻已經到來。” 2026年1月5日，拉斯維加斯CES展會，英偉達創始人兼CEO黃仁勳宣告AI正式進入新階段。在他看來，AI的演進可以分為四個階段：Perception AI、Generative AI、Agentic AI、Physical AI。當模型能夠理解質量、摩擦、慣性、動量守恆，AI才真正走出屏幕。他同時指出，要讓機器人理解物理世界，不能僅靠單一模型，而是需要建立一整套智能系統。黃仁勳描繪了未來願景，但一個問題擺在了所有人面前——物理世界的AI，到底需要什麼樣的技術能力？ AI真正走向物理世界，機器人、無人機、安防攝像頭、可穿戴設備這些場景，需要的不是回答問題，而是持續工作。物理AI最重要的，也就是主動執行的能力。 Om AI聯匯CEO兼首席科學家趙天成博士表示：“之前整個業內對通用視覺智能的關注度偏低，大家可能更關注一些可以看秀的表演或操作場景。但通用視覺這個點是未來物理AI真正規模化應用落地必不可少的，而且可能是更加現實、更加直接的核心技術，會更廣泛地應用到所有物理AI場景。” 通用視覺智能（General Vision Intelligence），即模型能像人一樣持續觀察環境、精準定位目標、自主驅動行動，且這一切必須在端側完成。近日發佈的VLX端側流式多模態模型系列，正是這一路徑的最新實踐。這是業界首次提出 “流式多模態” 這一全新模型架構。區別於傳統模型“採集-上傳-離線處理”的路徑，VLX系列面向物理世界中持續湧入的視頻流，實現毫秒級實時感知，並首次在端側打通“持續感知→精準定位→行動決策”的完整閉環。一、三個模型、三層能力、一條鏈路什麼是通用視覺智能（General Vision Intelligence）？ Om AI聯匯的定義是三項核心能力：持續感知（無需人工觸發）、空

47 分鐘前閱讀分析

AIBase生成式AI

ChatGPT全球用戶激增：非英語用戶佔比過半，全面跨越早期圈層

OpenAI報告顯示，ChatGPT全球用戶持續多元增長，年齡、性別、地域分佈更廣。非英語使用量顯著提升，超半數活躍用戶以其他語言為主，其中西班牙語、葡萄（牙語）等語言增長突出。

1 小時前4300閱讀分析

AIBase生成式AI

AI日報：谷歌推新圖片模型Nano Banana 2 Lite；Claude Sonnet 5 發佈；OpenClaw 正式推出 iOS 與 Android 移動版應用

歡迎來到【AI日報】欄目!這裡是你每天探索人工智能世界的指南，每天我們為你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。新鮮AI產品點擊瞭解：https://app.aibase.com/zh1、谷歌推出全新AI生圖模型NanoBanana2Lite：4秒出圖，主打高頻批量內容生產谷歌推出了全新的AI圖像與視頻生成模型NanoBanana2Lite，該模型在運行速度和成本效益方面都有顯著提升。其核心模型Kimi的價格調整不僅未影響需求，反帶來顯著收入增長，顯示出強大的市場競爭力。

2 小時前6100閱讀分析

相關文章

谷歌貼身對標字節：最新輕量版 Nano Banana 2 四秒出圖，單張僅 0.034 美元，還能直出視頻

時隔4個月，谷歌Nano Banana再發新模型

OpenAI：ChatGPT 全球採用率持續擴大，非英語用戶佔比過半

黃仁勳的物理AI ChatGPT時刻，正被這家中國公司的“流式多模態”接棒

ChatGPT全球用戶激增：非英語用戶佔比過半，全面跨越早期圈層

AI日報：谷歌推新圖片模型Nano Banana 2 Lite；Claude Sonnet 5 發佈；OpenClaw 正式推出 iOS 與 Android 移動版應用