雷峰網生成式AI

Fable 5 剛被封殺,OpenRouter 用「多模型協作」搞出了「平替天團」

2026年6月22日 10:03

重點摘要

最強 AI 突遭封殺下架,多模型協作能否填補空白? 作者丨高允毅 編輯丨馬曉寧 當世界上最聰明的 AI 被強制拔掉網線,我們能否有另一套方案,用上同樣聰明的智力?2026年6月14日,全球最大的大模型 API 聚合平臺OpenRouter,在 X 上發佈一條推文,短短幾天,吸引近600萬人圍觀。該平臺宣佈推出了世界上最聰明的“複合模型”Fusion API ,能用模型組合的方式,復刻 Claude Fable 5 的智力水平。 所謂“複合模型”,不是靠一個 AI 自己埋頭苦幹,而是讓好多 AI 模型一塊兒配合,做出一份最好的答案,再交給用戶,對外統一用一個API 入口。Fusion API 的橫空出世,踩中了一個微妙的時機。 就在同一周,Anthropic 剛發佈了 史上最強模型Claude Fable 5。該模型以強悍的長週期智能體推理出圈,能將企業原本需要數月的代碼遷移工作縮短至一天。然而,發佈僅 3 天,美國政府便籤發了緊急出口管制令。Anthropic 官方被迫切斷全球網絡,暫停該模型的 API 訪問,原本躍躍欲試的開發者們,瞬間哀嚎遍野。OpenRouter這條推文,正是精準地踩在了市場真空期的最痛點,同時給出一套新方案:與其押注單一模型,不如讓一群模型"開會"。它公佈了一組驚人數據:在深度研究中,由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 組成的“模型專家團”,融合後不僅輕鬆擊敗了 Opus 4.8,其綜合智力與被禁的 Fable 5 相比,得分誤差不到 1%。(注:Claude Fable 5 因內容過濾僅完成 DRACO 100 道任務中的 93 道,中端模型組合完整跑完全部 100 題,二者評測樣本存在差異。)而實現這一切的調用成本,僅僅是 Fable 5 的一半。01Fusion API背後的“多模型拼盤”O

站內 AI 整理稿

最強 AI 突遭封殺下架,多模型協作能否填補空白? 作者丨高允毅 編輯丨馬曉寧 當世界上最聰明的 AI 被強制拔掉網線,我們能否有另一套方案,用上同樣聰明的智力?2026年6月14日,全球最大的大模型 API 聚合平臺OpenRouter,在 X 上發佈一條推文,短短幾天,吸引近600萬人圍觀。該平臺宣佈推出了世界上最聰明的“複合模型”Fusion API ,能用模型組合的方式,復刻 Claude Fable 5 的智力水平。 所謂“複合模型”,不是靠一個 AI 自己埋頭苦幹,而是讓好多 AI 模型一塊兒配合,做出一份最好的答案,再交給用戶,對外統一用一個API 入口。Fusion API 的橫空出世,踩中了一個微妙的時機。 就在同一周,Anthropic 剛發佈了 史上最強模型Claude Fable 5。該模型以強悍的長週期智能體推理出圈,能將企業原本需要數月的代碼遷移工作縮短至一天。然而,發佈僅 3 天,美國政府便籤發了緊急出口管制令。Anthropic 官方被迫切斷全球網絡,暫停該模型的 API 訪問,原本躍躍欲試的開發者們,瞬間哀嚎遍野。OpenRouter這條推文,正是精準地踩在了市場真空期的最痛點,同時給出一套新方案:與其押注單一模型,不如讓一群模型"開會"。它公佈了一組驚人數據:在深度研究中,由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 組成的“模型專家團”,融合後不僅輕鬆擊敗了 Opus 4.8,其綜合智力與被禁的 Fable 5 相比,得分誤差不到 1%。(注:Claude Fable 5 因內容過濾僅完成 DRACO 100 道任務中的 93 道,中端模型組合完整跑完全部 100 題,二者評測樣本存在差異。)而實現這一切的調用成本,僅僅是 Fable 5 的一半。01Fusion API背後的“多模型拼盤”OpenRouter 將 Fusion 冠以“市場上最智能複合模型”的稱號,確實帶有營銷色彩。從底層來看,它的原理是將“多模型並行、裁判海選、終審合成”三步走流程化、標準化的工程解法。第一步:專家團模型的“頭腦風暴” 首先,用戶的提示詞一經觸發,系統會將其同時派發給最多8 個“專家模型”,包括Fable 5、GPT-5.5、Gemini 3.1 Pro以及國產好評的GLM-5.2、Kimi K2.6等眾多模型。 值得注意的是,為了防止模型“閉門造車”,系統在底層為所有專家統一配備了實時聯網搜索與網頁內容抓取工具。這意味著,專家模型們在交卷前,可以查閱全網最新的參考資料。這種實時交互,讓 Fusion 徹底區別於簡單的“少數服從多數”的盲目投票。第二步:裁判模型來挑刺 這是 Fusion 的靈魂所在。一個被指定當“裁判”的模型,會把所有專家的回答看一遍,然後寫出一份細緻的分析報告。它會特別嚴格地把這些回答裡的意見一致的地方、 互相矛盾的地方、特別出彩的個人見解,還有大家都沒注意到的盲點,一條條都揪出來。第三步:主筆模型最後定稿 裁判的報告出來之後, 一個主筆模型就上場了。它會吸收所有專家的優點,排除掉個別模型瞎編的東西,最後產出一份沒有技術矛盾、邏輯順暢的高質量回答。在這裡,OpenRouter 展現了一個很聰明的工程設計:為了避免多次調用導致系統延遲全面崩塌,它巧妙地讓“裁判”與“主筆”兩件事,放在同一個超級大模型的一次思考裡一口氣完成。那些複雜的開會、辯論、審計、整合,全都在後臺悄悄做完了,用戶最終只是一個乾乾淨淨的結果。Fusion的這套思路,其實在學術界早有探索。2024年,Together AI 團隊正式提出的一種多模型協同技術範式,又稱MoA。它的核心邏輯是“三個臭皮匠,頂個諸葛亮”,不再死磕一個超級貴、超級大的單個模型,而是分好幾層,讓一組便宜些的模型同時想,再讓一個高級模型當評委,最後出來的答案,反而比任何單個模型都強。 在 MoA 正式提出之前,學界長期爭論一個猜想:把好多比較弱的模型湊在一起,能不能出現比最強模型還好的集體智慧? 於是就有了這種讓 AI 組團辯論的方法。從很早將工具與模型縫合的複合 AI 系統,到 2023 年把多個模型的輸出直接糅合的工具,再到 2024 年穀歌讓多個智能體像開會一樣辯論的論文,學術界早已論證了同一件事:組合拳的輸出遠比單打獨鬥更具確定性。Fusion 的核心價值在於它是行業首個將完整 “多模型合議” 流程標準化、託管化、開箱即用的商用 API 產品。 它把一整套複雜架構變成了一項可以託管的、即插即用的 API,無需任何基礎設施。開發者不用自己再去搭服務器、調參數。只要改一行代碼,就能直接指揮一整個專家團。在真正落地的過程裡,OpenRouter 表現得很務實,主要體現在兩個機制上:第一,給用戶完全透明的控制權:你可以自己決定讓哪些模型當評審,讓哪個模型當最後的主裁判。如果國外的服務不好用,你還能讓咱們的國產大模型挑大樑。甚至可以給不同模型分配重要程度,讓整個合作網完全聽你指揮。第二,極具靈巧性的“動態智能門控”:這個功能像一個工具箱裡的小插件。平時問點簡單的問題,系統會自動識別,直接讓一個便宜的模型秒回,根本不啟動複雜的開會流程。只有碰到特別難、需要深思熟慮的問題時,才會把一群模型叫起來,一起商量。02在DRACO基準測試中的“聰明”表現Fusion這套“組隊幹活”的聰明效果,在 Perplexity AI 發佈的權威深度研究基準測試 DRACO 中得到了直接印證。作為一個專門測試 AI 深度研究能力的硬核考場,DRACO 包含了法律、金融、醫學等 10 個領域的 100 道複雜任務。它的規則極其嚴苛,採用“負分淘汰制”,每道題約有39 個判定標準進行全方位“挑刺”,回答錯誤或硬湊字數,都會被扣分。為了防止運氣成分,每個回答要找三個不同的裁判,各看一次,最後取一個穩定的平均分。在DRACO的真實評測中,可以看到一些有趣的信息:總榜排在最前列的幾乎清一色是“組合模型”,其實際效果把排在後方的單體模型遠遠甩在了身後“自己和自己組隊”也能變強:利用 Fusion 機制,即便是相同的模型融合,也能實現超越前沿的性能。比如兩個Claude Opus 4.8 互相融合,其最終的得分不僅遠超自己,甚至直接超越了Fable 5。最有趣的是,哪怕不用昂貴的頂級模型,用中端模型組隊同樣能逼近天花板。由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 組成的“平民專家隊”,在經過 Fusion組合後,以不到 1% 的微弱得分差距,正面直逼 Fable 5。 當然,最強的模型組合依然來自最強模型的強強聯手,Fable 5+GPT-5.5霸榜第一。但需要注意的是,DRACO只考察“純文字、純英文”的深度研究能力,不包含長週期動態任務、代碼運行、多模態與非英文場景。這種固定的測評體系,無法考察將來實際用起來是什麼樣;而且分數多少,也跟找誰來當裁判有很大關係,不同的評委大模型,絕對分數會產生 10 到 25 分的巨大波動,但相對系統排名保持穩定。簡而言之,Fusion的絕對優勢,主要在研究複雜問題,把很多信息揉在一起, 寫出一份的高質量深度報告這件事上。03最吸引人的經濟賬:真的只要一半嗎?Fusion最受人們關注的是莫過於那句口號:只用一半的價格,達到Fable 5的智力效果。眾所周知,Claude Fable 5 的價格堪稱昂貴,其輸入每百萬 Token 為 10 美元,輸出每百萬 Token 達 50 美元。這一價格正好是前代旗艦 Claude Opus 4.8 的兩倍,也是目前市場上最昂貴的前沿大模型之一。如果真的能省下一半成本,開發者們自然趨之若鶩。但 Fusion 這筆賬到底是怎麼算的?Fusion 的收費規則是“你調用了幾個模型就得付幾個模型的錢。”,這意味著一條提示詞如果被路由分配到 4 個模型,用戶就要付 4 次錢。這讓很多開發者直呼“太貴了”。那為什麼它最終還能省錢?秘密在於 Token 價格的極端不對稱性:大模型的輸入成本通常極其廉價,而長篇大論的輸出成本卻極其高昂。Fusion 省錢的本質,就是“多花好幾份極便宜的輸入費”,去避開那個“最貴最貴的輸出費”。以4個模型為例,雖然4 個模型的輸入都需要付錢,但只付了 4 次很便宜的輸入費,但最終答案,只有一個模型輸出。所以真正花大錢的地方,只有一份。如果配合前文提到的“動態智能門控”,這筆賬還會更划算。當公司大規模跑業務的時候,90% 的簡單問題,可以自動分給便宜又好用的模型了。 只有那 10% 超級難的、觸及能力上限的問題,才會啟動 Fusion 開會。這樣算下來,整體成本可能比“全部用昂貴模型”還要低。而真正讓 OpenRouter 敢喊出“成本減半”的終極底氣,來自於它有一個功能叫“提示詞緩存”。當你要處理的文本特別長,或者系統指令裡有一大段固定不變的東西,哪怕輸入再便宜,一旦要讓 4 個甚至 8 個模型都看一遍,總價還是很嚇人的。但 Fusion 聰明就聰明在,多個專家模型可以同時用同一份緩存好的數據。除了第一次要付全價,後面再讀同樣的東西,就只要付一頓幾乎可以忽略的零頭,大概只有原價的 10% 到 20%。如果沒有提示詞緩存這項技術託底,多模型辯論就只是一個“開著豪車送外賣”的工程烏托邦。把賬算清楚之後,企業做技術的人就能清楚知道Fusion的使用邊界,什麼場景能省錢,什麼場景會破產?當你遇到了一個超級難題,單憑任何一個模型都搞不定,你原本只能咬牙花大價錢用最牛的那個。現在你用 4 箇中等模型組隊,加上緩存,總賬單確實能比天價模型便宜一大截。反而會更貴的場景是:如果你的日常工作,本來一個便宜模型就能輕鬆搞定,你卻非要逼著大家組隊上,那多模型並行帶來的太多額外花費,很快就能把公司賬目搞崩。簡而言之,Fusion 是一場精準的賬目精算。它是最牛模型非常好的平價替代,但絕對不是普通便宜模型的平價替代。過去,科技公司靠不斷堆出一個超級貴、超級大的單模型來壟斷掙錢。 但現在,這種壟斷,正在被“便宜模型組合”、“聰明開關”加上“緩存優化”,這一套組合拳給打破了。Fusion給了我們一個選擇空間,在 AI 這個賽道下半場,你不需要買那個最貴的單模型了,一套足夠聰明的調度系統也可以成為平替方案。04三個沒那麼光鮮的工程黑洞儘管概念驚豔,但目前 Fusion 依然無法直接替代 Fable 5。作為一個尚處早期探索階段的產物,在開發者和企業最在意的真實落地戰場上,它暴露出三個不容忽視的致命短板。▎ 問題一:編程場景不實用官方明確指出,Fusion並非編碼模型的直接替代品,它更像一個帶著搜索和運行環境的“高級智囊團”。 這決定了它在編程場景應用中的明顯分化。在應對複雜架構設計、技術選型或百年不遇的報錯原因時,它能發揮多方求證的優勢;但在開發者日常寫代碼的主戰場,它反而比普通模型難用得多。核心原因有三:(1)寫代碼要快,它太慢了:因為Fusion底下是好幾個模型在協作,反應速度根本跟不上你在編輯器裡敲代碼的節奏,像代碼補全、修語法這種要秒回的活兒,它幹不了。 (2)處理大工程容易“斷片”:在面對超長上下文或“整個倉庫重構”級別的任務時,Fusion 那種把任務切給好幾個模型的做法,很容易讓上下文斷掉,目前無法像 Fable 5 那樣完美保持 200k+ token 的長程連貫性。(3)拼出來的代碼可能根本跑不起來:有深度用戶反饋,它的裁判模型只負責在意思上“開會總結”,沒有真正的編譯器去當場驗證。這導致它有時候會犯很低級的工程錯誤,把不同語言、甚至邏輯互相打架的代碼片段硬縫在一起,結果代碼一跑就崩。▎問題二:非常慢由於 Fusion要同時叫好幾個不同的模型一起幹活,所以它的反應速度特別慢,通常耗時是單一普通模型的 2 到 4 倍。這就像一群人一起做一件事,必須等最磨蹭的那個人幹完,大家才能往下走。系統必須等所有模型全跑完,整個鏈條的總時間,就直接卡在後臺反應最慢、網絡最卡的那個模型身上。更花時間的是,等所有模型都交卷了,後臺還得讓裁判模型把所有結果處理一遍,才能生成最終答案。在今天這個連“首字延遲”都要按毫秒摳的實際工作場景中,這種慢可以說是致命的,這也註定了它沒法用在實時客服聊天,或者代碼即時補全這種要速度的戰場上。 ▎問題三:數據合規的黑箱這是企業系統落地時最難規避的合規死穴。當開發者向 Fusion 發起請求,意味著同一個提示詞和上下文,在同一秒內經過了全球多家不同的 AI 服務商的服務器。面對嚴苛的數據隱私法規,企業的法務和網絡安全團隊必須評估多路分發帶來的隱患:這些服務商會如何留存數據?OpenRouter 作為中間路由層,又能否提供有效的技術擔保?這個問題的答案目前依然是不透明的。05多模型協作時代全面到來了嗎?在 Fusion 身上,有人看到了“多模型協作(MoA)”的強勢崛起,也有人嘲笑這是 AI 發展從“煉丹求道”向“縫縫補補的軟件工程”的倒退。過去兩年,整個行業陷入了對“萬億參數單體戰神”的盲目崇拜中,堅信只要算力足夠大,就能大力出奇跡。但隨著算力邊際效應的遞減,Fusion 用一套精巧的拼盤方案證明了:系統的整體能力,完全可以大於單體之和。這套邏輯,正在從三個維度重塑整個 AI 行業的底層邏輯:▎1.商業權力的重構:打破“超級模型”的定價霸權長期以來,像 Anthropic 或 OpenAI 這樣的頭部玩家,試圖通過單體模型的能力碾壓,建立起極高的定價護城河。但 Fusion 的出現,是對這種商業模式的降維打擊。一旦“一個 Opus + 三個中等模型”能打平 Fable 5,大模型能力的“商品化”時代就真正到來了。底層模型將變得像雲服務器裡的 CPU 算力一樣,不再具有不可替代的神秘光環。這不僅會逼著前沿大模型重新想想自己是不是賣太貴了,甚至得降價,還會催生出像 OpenRouter 這樣,手裡握著“流量分發權”的超級路由平臺。在未來,誰掌握了調度系統,誰就掌握了 AI 時代的“終極入口”。▎2.地緣政治風險讓"多模型依賴"從可選變成必需。Fable 5 發佈僅三天就被緊急拔掉網線,給全球開發者上了一堂極其生動的一課:將全部業務核心押注在單一大模型上的風險,比很多開發者以為的要高。Fusion 這類"拼盤"方案,在合規意義上也是一種風險對沖。這也是國產大模型的絕佳窗口期。Fable 5 被封后,智譜迅速宣佈 GLM-5.2 全量開放,並喊出“前沿智能不該被少數規則隨時收回”。而 DeepSeek V4 Pro 等高性價比模型在 DRACO 測試中的驚豔表現,讓市場意識到:國產模型不需要在所有指標上死磕第一,只要能在 MoA 的“專家庫”裡佔據一席之地,成為那 90% 高性價比流量的承接者,就已經是一場巨大的商業勝利。▎3.技術演進的新瓶頸:得“主裁判”者得天下當然,多模型協作絕非完美的烏托邦。當下限被一群廉價專家模型拉高時,整個系統的智力上限,死死卡在了“裁判模型”的瓶頸上。裁判模型的綜合評審能力、消除幻覺的能力以及對抗偏見的能力,決定了最終輸出是“博採眾長”還是“一地雞毛”。如果裁判本身存在盲點,多模型協作反而會放大錯誤。回望 Fusion API 爆火的這幾天,它像是一個行業清醒劑。"桌上還有很多盞小燈,把它們擺對位置,照樣能照亮前路。"雷峰網認為,對於當下的企業和開發者而言,Fusion 值不值得用?答案已經寫在了它的架構基因裡。參考鏈接:https://x.com/OpenRouter/status/2065856853989270011

Related

相關文章

智東西生成式AI

庫克攤牌了:漲價!

智東西 編譯 | 陳佳 編輯 | 雲鵬 智東西6月22日消息,據《華爾街日報》昨日報道,AI行業對存儲芯片的海量需求正引發一場波及全球的消費電子漲價潮。蘋果、微軟、任天堂、索尼等廠商近期密集上調產品售價,蘋果公司CEO蒂姆·庫克(Tim Cook)坦言公司已無力獨自消化上游成本上漲壓力,計劃在未來數月上調產品售價。 這場漲價的根源直指AI產業擴張。DRAM和NAND閃存既是手機、筆記本、遊戲主機等消費設備的基礎硬件,也是AI企業訓練和運行大模型的關鍵資源。AI行業的爆發式增長大量吞噬了同類芯片產能,導致全球存儲芯片供應陷入嚴重緊缺。 芯片廠商從中大幅獲益,全球三家存儲芯片巨頭——SK海力士、三星電子和美光科技,成為最大贏家。過去半年SK海力士與美光市值均飆漲約四倍,各自突破1萬億美元(約合人民幣6.77萬億元)。 而成本壓力層層向消費者端傳導,過去一年美光一款主流數據中心內存芯片合約價漲幅接近4倍。 據Investing 2026年6月20日報道,高盛下調了2026年和2027年全球智能手機出貨量預測,理由是存儲芯片價格持續上漲抑制市場需求。 在新設備售價持續走高的背景下,二手翻新設備市場正迎來新一輪增長窗口,多家翻新交易平臺在品質管控和售後保障方面持續加碼。 與此同時,分析師預測新建晶圓廠需要兩到三年才能投產,芯片短缺和漲價態勢還將持續數年,消費電子買家短期內難以等到降價拐點。 一、各品類消費電子密集漲價,成本壓力轉嫁給消費者 消費者已在各類產品上切身感受到漲價衝擊。微軟上週公佈新款Surface Pro筆記本起售價為1599美元(約合人民幣1.08萬元),較上一代產品上漲600美元(約合人民幣4062元)。 任天堂5月將Switch 2遊戲主機售價上調50美元(約合人民幣339元)至499美元(約合人民幣3378元),官方就此致歉稱“為本次調價給消費者帶來的影響致以誠摯

3 小時前
智東西生成式AI

剛剛,阿里HappyHorse1.1上線,我用它把國足送進世界盃

智東西 作者 | 陳駿達 編輯 | 心緣 智東西6月22日報道,今天,阿里巴巴發佈了其最新一代視頻生成模型HappyHorse 1.1(快樂小馬1.1)。阿里稱,相比HappyHorse 1.1,這代模型在動態表現力、主體一致性、指令遵循、視覺質感和音頻能力等維度有了一定提升。 HappyHorse 1.1的技術規格與HappyHorse 1.0保持一致,單次生成時長為3至15秒,支持720p和1080p分辨率和自由寬高比。 阿里官方曬出了幾個HappyHorse 1.1的生成結果。在舞蹈這類考驗模型動態表現力和動作連貫性的任務上,HappyHorse 1.1生成的動作流暢自然,沒有像過去許多視頻生成模型一樣出現慢動作、殘影等問題,人體特徵符合正常情況,長相也保持了一致。 在風格化內容方面,HappyHorse 1.1在下方案例中很好地保持了傳統中國畫的畫風,沒有出現風格偏移等問題。 模型發佈後,智東西第一時間對HappyHorse 1.1進行了實測,並將其表現與HappyHorse 1.0和近期發佈的Seedance 2.0 Mini進行了對比。從實測結果看來,HappyHorse 1.1較上一代模型的確實現了一定提升,尤其是畫面“油膩感”問題得到了較好的解決。不過,在部分邊緣場景、多參考主體的任務上,其生成結果的真實感、物理規律遵循還有優化空間。 目前,HappyHorse 1.1已經上線阿里雲百鍊平臺和HappyHorse官網。以文生視頻為例,其生成720p清晰度畫面的價格為每秒0.9元(優惠後0.54元),與HappyHorse 1.0保持一致;生成1080p清晰度畫面的價格為每秒1.2元(優惠後為0.72元),與HappyHorse 1.0相比下調了25%。 體驗鏈接:www.happyhorse.cn API接入:bailian.console.aliyun.c

4 小時前