35B Agent超越萬億參數模型？上海AI Lab開源Agents-A1：scaling the Horizon

2026年7月2日 12:19

重點摘要

這篇消息聚焦「35B Agent超越萬億參數模型？上海AI Lab開源Agents-A1：scaling the Horizon」。原始導語提到：不堆參數，也能很強。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

### 重點整理：35B Agent如何以小博大？

上海人工智慧實驗室（上海AI Lab）近期開源了一款名為「Agents-A1」的模型，引發業界矚目。這款模型僅有350億參數（35B），卻在部分任務上聲稱超越參數量高達萬億等級的競爭對手。其核心亮點在於「不堆參數，也能很強」——透過更高效的訓練策略、數據篩選與架構設計，實現了在特定Agent場景下的性能突破。這打破了傳統「參數量越大、能力越強」的直觀印象，也為資源有限的開發者提供了新的可能性。

### 背景脈絡：參數量競賽的反思

近年來，AI領域的參數軍備競賽愈演愈烈，從GPT-3的1750億到萬億規模的模型，訓練成本與能源消耗不斷攀升。然而，巨大的參數量並非總是帶來線性的效能提升，尤其在某些任務（如工具使用、多步推理）中，模型能否「理解」與「執行」往往更依賴於訓練資料的品質與架構的設計。上海AI Lab的Agents-A1正是基於這樣的反思：與其盲目疊加參數，不如專注於Agent能力（即自主執行任務、調用工具、記憶回顧）的優化。這種「精實」策略不僅降低了硬體門檻，也讓更多團隊有機會參與前沿研究。

### 可能影響：平民化與生態轉向

Agents-A1的開源意義深遠。首先，它降低了AI Agent研發的進入門檻——以往需要數千張高階GPU才能訓練的模型，現在可能只需少量算力即可進行微調或推理。這對台灣的新創團隊、學術單位尤其有利，因為他們不必追逐昂貴的硬體，而是可以專注於應用場景的開發。其次，這可能帶動業界評測標準的轉變：未來或許不再只比參數量，而是比「每參數的效能比」或「任務完成率」。最後，開源社群可望圍繞Agents-A1建立工具鏈，形成類似Hugging Face的生態，進一步加速Agent技術的普及。

### 讀者可關注的後續

接下來值得關注幾個方向：一是上海AI Lab是否會公開Agents-A1的詳細訓練配方，例如資料集組成、訓練超參數等，這將直接影響其他團隊能否複現成果；二是該模型在中文環境下的工具呼叫、API對接等實際表現，因為台灣開發者常需處理在地化需求；三是開源授權方式——若採用寬鬆授權（如Apache 2.0），則商業應用阻力較小；四是後續是否有更大規模的Agent模型（如70B或更高）推出，以驗證其「縮放法則」是否成立。建議有興趣的讀者密切追蹤GitHub倉庫的更新，並嘗試在個人專案中導入測試，親身體驗35B模型與萬億模型在真實場景中的差異。

原始來源：36氪 ↗

查看原始來源

36氪AI Agent

一個開源平臺，編織起了Agent「互聯網」

這篇消息聚焦「一個開源平臺，編織起了Agent「互聯網」」。原始導語提到：「Agents do. Humans decide. That’s Octo.」從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

36氪AI Agent

國產AI六巨頭逐鹿Agent，望得到Claude Code的背影嗎？

阿里、騰訊、字節、Kimi、MiniMax、智譜等國產AI六巨頭正積極投入Agent領域的競爭。業界關注這些廠商的產品研發是否能追趕上Claude Code的技術水準。目前各方仍在快速迭代，尚難斷定誰能勝出。

剛剛閱讀分析

AIBaseAI Agent

兩分鐘上手生產級語音智能體：xAI 發佈 Voice Agent Builder 測試版

xAI推出Voice Agent Builder測試版，通過零代碼平臺和自研Grok Voice模型，將企業級語音智能體搭建縮短至兩分鐘。其核心為高度集成的端到端架構，解決了傳統方案語音轉文字等多環節割裂的痛點，大幅降低了開發與運營門檻。

2 小時前6900閱讀分析

雷峰網AI Agent

從生成到交付，音視頻 Agent 要有生產級開發套件

過去足球賽場上的高光瞬間回顧，往往需要剪輯師回看素材，找到進球、慶祝、慢動作回放和觀眾反應，再切片、包裝、加字幕，最後分發到不同平臺。鏈路長，人工重，能不能接到熱點爆發的流量，考驗的是人的經驗和手速。現在這條鏈路被拆開重組，開始由模型和工具鏈來接管賽事高光視頻的完整生產流程。在新的鏈路中，AI 已經可以實時理解直播流，識別鏡頭切換、音頻變化、球員慶祝、裁判哨音等信號，在關鍵事件發生後快速返回高光片段，生成可分發的獨立切片。熱點剛爆，視頻就已經完成了跟進。背後的變化不只是某個工具效率變高了，而是音視頻內容生產方式正在從人驅動的工作流，進化為 Agent 驅動的工作流。這不僅是在調用模型去生成、處理音視頻內容，而是在此基礎上形成了新的生產工具、新的生產流程，真正在靠近“一句話創作一條成片”的理想狀態。這種視頻生產範式的革新，需要由新的技術底座提供支撐。火山引擎 AI Media Platform 產品負責人杭夢鈺在2026夏季FORCE原動力大會智能視頻雲分論壇的分享中提到，從“生成一段畫面”走到“交付一部能上線、可以被消費、傳播給觀眾的成片”，中間還差一整段專業的音視頻處理工作。這段工作需要 AI MediaKit 這種面向 Agent 的音視頻開發套件來提供支持。這類開發套件能把視頻理解、剪輯、字幕、畫質增強、轉碼、音頻處理、圖像處理等能力，重新封裝成 Agent 可以理解、調用和編排的工具底座，讓其能貫通理解、處理到交付的完整音視頻創作鏈路。這意味著，視頻雲要解決的不是“生成”本身，而是生成之後如何實現生產級交付；行業對視頻雲的要求不再只是接入一個模型，或者提供一個生成接口。競爭正在轉向更深的工程層面：比拼誰能把複雜的音視頻能力變成 Agent 可調用、開發者可集成、產業場景可落地的生產級工具。第一部分：要生成內容，更要交付結果AI 視頻過去兩年的進步，首先解決的是“從無

2 小時前閱讀分析

AIBaseAI Agent

蘋果 Safari 預覽版新增 MCP 服務，AI 智能體助力網頁開發調試

7月1日，蘋果WebKit團隊在Safari技術預覽版247中上線MCP服務器，通過AI智能體簡化前端開發與調試。MCP即模型上下文協議，開放標準，可讓AI智能體對接工具和數據庫，實現讀寫與授權，打通AI開發數據通道。

4 小時前4900閱讀分析

雷峰網AI Agent

ICML 2026前瞻：投稿翻倍背後，機器學習正在換擋

首爾見，ICML見，新方向見。作者丨吳思夢編輯丨岑峰 7月6日–11日，第43屆國際機器學習大會（ICML 2026）將首次落地韓國首爾COEX會展中心舉行，會議主題為“Machine Learning for the Real World”，強調機器學習在真實場景中的落地。（圖源： CS Conf Stats）根據計算機科學會議統計看板 CS Conf Stats的最新數據顯示，今年共接收論文6352篇（常規主賽道論文），102%的增幅，接受率26.6%，與去年的26.9%基本持平。23918篇投稿，6352篇接收，26.6%接受率，Spotlight佔比2.2%，Oral 演講佔總投稿數的 0.7%——ICML創辦43年來，還沒有哪一年的投稿量像今年這樣翻倍式增長。而在投稿量翻倍的前提下維持接受率，也傳遞出會議正在主動擴容的訊號。除此之外，今年兩項全新的制度調整，為學術社區帶來了透明度的實質性變化：其一是參會展示改為可選，接收論文作者可以選擇僅以論文集形式收錄，在會議記錄中享有同等地位且均可參評獎項。其二是原始投稿版本將被公開，包括匿名評審意見、作者Rebuttal及審稿人、作者討論內容。01三大趨勢重塑行業走向，具身模型成熱門把近三年ICML的熱點關鍵詞串聯起來，機器學習的轉向脈絡會格外清晰：2024-2025年的熱點“Transformer變體、PEFT微調、擴散模型優化”已日漸飽和，純粹的增量改進在ICML極難生存。2025年底以來談論最多的的紅利方向，諸如Alignment、Agent、可解釋性、測試時訓練（TTT）正在成為今年論文的主體。而當前正在搶佔的戰略高地，是具身智能的世界模型、科學計算的深水區，以及可信AI的政策框架。如果說論文數量反映的是“關注度”，那論文方向的變化反映的是“行業焦慮”。從今年ICML論文反映的技術版圖裡，有三個不可忽視的信號：

4 小時前閱讀分析

相關文章

一個開源平臺，編織起了Agent「互聯網」

國產AI六巨頭逐鹿Agent，望得到Claude Code的背影嗎？

兩分鐘上手生產級語音智能體：xAI 發佈 Voice Agent Builder 測試版

從生成到交付，音視頻 Agent 要有生產級開發套件

蘋果 Safari 預覽版新增 MCP 服務，AI 智能體助力網頁開發調試

ICML 2026前瞻：投稿翻倍背後，機器學習正在換擋