35B Agent超越萬億參數模型?上海AI Lab開源Agents-A1:scaling the Horizon

重點摘要
這篇消息聚焦「35B Agent超越萬億參數模型?上海AI Lab開源Agents-A1:scaling the Horizon」。原始導語提到:不堆參數,也能很強。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
### 重點整理:35B Agent如何以小博大?
上海人工智慧實驗室(上海AI Lab)近期開源了一款名為「Agents-A1」的模型,引發業界矚目。這款模型僅有350億參數(35B),卻在部分任務上聲稱超越參數量高達萬億等級的競爭對手。其核心亮點在於「不堆參數,也能很強」——透過更高效的訓練策略、數據篩選與架構設計,實現了在特定Agent場景下的性能突破。這打破了傳統「參數量越大、能力越強」的直觀印象,也為資源有限的開發者提供了新的可能性。
### 背景脈絡:參數量競賽的反思
近年來,AI領域的參數軍備競賽愈演愈烈,從GPT-3的1750億到萬億規模的模型,訓練成本與能源消耗不斷攀升。然而,巨大的參數量並非總是帶來線性的效能提升,尤其在某些任務(如工具使用、多步推理)中,模型能否「理解」與「執行」往往更依賴於訓練資料的品質與架構的設計。上海AI Lab的Agents-A1正是基於這樣的反思:與其盲目疊加參數,不如專注於Agent能力(即自主執行任務、調用工具、記憶回顧)的優化。這種「精實」策略不僅降低了硬體門檻,也讓更多團隊有機會參與前沿研究。
### 可能影響:平民化與生態轉向
Agents-A1的開源意義深遠。首先,它降低了AI Agent研發的進入門檻——以往需要數千張高階GPU才能訓練的模型,現在可能只需少量算力即可進行微調或推理。這對台灣的新創團隊、學術單位尤其有利,因為他們不必追逐昂貴的硬體,而是可以專注於應用場景的開發。其次,這可能帶動業界評測標準的轉變:未來或許不再只比參數量,而是比「每參數的效能比」或「任務完成率」。最後,開源社群可望圍繞Agents-A1建立工具鏈,形成類似Hugging Face的生態,進一步加速Agent技術的普及。
### 讀者可關注的後續
接下來值得關注幾個方向:一是上海AI Lab是否會公開Agents-A1的詳細訓練配方,例如資料集組成、訓練超參數等,這將直接影響其他團隊能否複現成果;二是該模型在中文環境下的工具呼叫、API對接等實際表現,因為台灣開發者常需處理在地化需求;三是開源授權方式——若採用寬鬆授權(如Apache 2.0),則商業應用阻力較小;四是後續是否有更大規模的Agent模型(如70B或更高)推出,以驗證其「縮放法則」是否成立。建議有興趣的讀者密切追蹤GitHub倉庫的更新,並嘗試在個人專案中導入測試,親身體驗35B模型與萬億模型在真實場景中的差異。
Related
相關文章

一個開源平臺,編織起了Agent「互聯網」
這篇消息聚焦「一個開源平臺,編織起了Agent「互聯網」」。原始導語提到:「Agents do. Humans decide. That’s Octo.」 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

國產AI六巨頭逐鹿Agent,望得到Claude Code的背影嗎?
阿里、騰訊、字節、Kimi、MiniMax、智譜等國產AI六巨頭正積極投入Agent領域的競爭。業界關注這些廠商的產品研發是否能追趕上Claude Code的技術水準。目前各方仍在快速迭代,尚難斷定誰能勝出。
兩分鐘上手生產級語音智能體:xAI 發佈 Voice Agent Builder 測試版
xAI推出Voice Agent Builder測試版,通過零代碼平臺和自研Grok Voice模型,將企業級語音智能體搭建縮短至兩分鐘。其核心為高度集成的端到端架構,解決了傳統方案語音轉文字等多環節割裂的痛點,大幅降低了開發與運營門檻。
從生成到交付,音視頻 Agent 要有生產級開發套件
過去足球賽場上的高光瞬間回顧,往往需要剪輯師回看素材,找到進球、慶祝、慢動作回放和觀眾反應,再切片、包裝、加字幕,最後分發到不同平臺。鏈路長,人工重,能不能接到熱點爆發的流量,考驗的是人的經驗和手速。現在這條鏈路被拆開重組,開始由模型和工具鏈來接管賽事高光視頻的完整生產流程。在新的鏈路中,AI 已經可以實時理解直播流,識別鏡頭切換、音頻變化、球員慶祝、裁判哨音等信號,在關鍵事件發生後快速返回高光片段,生成可分發的獨立切片。熱點剛爆,視頻就已經完成了跟進。背後的變化不只是某個工具效率變高了,而是音視頻內容生產方式正在從人驅動的工作流,進化為 Agent 驅動的工作流。這不僅是在調用模型去生成、處理音視頻內容,而是在此基礎上形成了新的生產工具、新的生產流程,真正在靠近“一句話創作一條成片”的理想狀態。這種視頻生產範式的革新,需要由新的技術底座提供支撐。火山引擎 AI Media Platform 產品負責人杭夢鈺在2026夏季FORCE原動力大會智能視頻雲分論壇的分享中提到,從“生成一段畫面”走到“交付一部能上線、可以被消費、傳播給觀眾的成片”,中間還差一整段專業的音視頻處理工作。這段工作需要 AI MediaKit 這種面向 Agent 的音視頻開發套件來提供支持。這類開發套件能把視頻理解、剪輯、字幕、畫質增強、轉碼、音頻處理、圖像處理等能力,重新封裝成 Agent 可以理解、調用和編排的工具底座,讓其能貫通理解、處理到交付的完整音視頻創作鏈路。這意味著,視頻雲要解決的不是“生成”本身,而是生成之後如何實現生產級交付;行業對視頻雲的要求不再只是接入一個模型,或者提供一個生成接口。競爭正在轉向更深的工程層面:比拼誰能把複雜的音視頻能力變成 Agent 可調用、開發者可集成、產業場景可落地的生產級工具。第一部分:要生成內容,更要交付結果AI 視頻過去兩年的進步,首先解決的是“從無
蘋果 Safari 預覽版新增 MCP 服務,AI 智能體助力網頁開發調試
7月1日,蘋果WebKit團隊在Safari技術預覽版247中上線MCP服務器,通過AI智能體簡化前端開發與調試。MCP即模型上下文協議,開放標準,可讓AI智能體對接工具和數據庫,實現讀寫與授權,打通AI開發數據通道。
ICML 2026前瞻:投稿翻倍背後,機器學習正在換擋
首爾見,ICML見,新方向見。 作者丨吳思夢 編輯丨岑 峰 7月6日–11日,第43屆國際機器學習大會(ICML 2026)將首次落地韓國首爾COEX會展中心舉行,會議主題為“Machine Learning for the Real World”,強調機器學習在真實場景中的落地。(圖源: CS Conf Stats)根據計算機科學會議統計看板 CS Conf Stats的最新數據顯示,今年共接收論文6352篇(常規主賽道論文),102%的增幅,接受率26.6%,與去年的26.9%基本持平。23918篇投稿,6352篇接收,26.6%接受率,Spotlight佔比2.2%,Oral 演講佔總投稿數的 0.7%——ICML創辦43年來,還沒有哪一年的投稿量像今年這樣翻倍式增長。而在投稿量翻倍的前提下維持接受率,也傳遞出會議正在主動擴容的訊號。除此之外,今年兩項全新的制度調整,為學術社區帶來了透明度的實質性變化:其一是參會展示改為可選,接收論文作者可以選擇僅以論文集形式收錄,在會議記錄中享有同等地位且均可參評獎項。其二是原始投稿版本將被公開,包括匿名評審意見、作者Rebuttal及審稿人、作者討論內容。01三大趨勢重塑行業走向,具身模型成熱門把近三年ICML的熱點關鍵詞串聯起來,機器學習的轉向脈絡會格外清晰:2024-2025年的熱點“Transformer變體、PEFT微調、擴散模型優化”已日漸飽和,純粹的增量改進在ICML極難生存。2025年底以來談論最多的的紅利方向,諸如Alignment、Agent、可解釋性、測試時訓練(TTT)正在成為今年論文的主體。而當前正在搶佔的戰略高地,是具身智能的世界模型、科學計算的深水區,以及可信AI的政策框架。如果說論文數量反映的是“關注度”,那論文方向的變化反映的是“行業焦慮”。從今年ICML論文反映的技術版圖裡,有三個不可忽視的信號: