富士通介紹 PHOTON 框架:1.2B 模型多查詢性能 475 倍於 Transformer

重點摘要
這篇消息聚焦「富士通介紹 PHOTON 框架:1.2B 模型多查詢性能 475 倍於 Transformer」。原始導語提到:PHOTON 能高效率低開銷地處理智能體系統等多 I/O 流程,從而降低 GPU 成本。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
富士通近日正式推出名為 PHOTON 的全新框架,並公開其驚人的性能數據:基於 1.2B 參數的模型在多查詢場景下,處理速度可達傳統 Transformer 的 475 倍。這一對比立即引發業界關注,因為 Transformer 架構是當前大語言模型與深度學習的主流基礎,但其在處理大量輸入輸出流程時卻存在明顯瓶頸。PHOTON 的出現,似乎為解決這一長期困擾提供了全新思路,特別是在智能體系統這類需要頻繁互動、多路並發的應用領域,可能帶來顛覆性變革。
傳統 Transformer 雖然在自然語言理解與生成上表現優異,但其自注意力機制的計算複雜度隨序列長度二次增長,導致批處理多條獨立查詢時效率急劇下降。尤其是面對智能體系統中常見的動態多輪對話、工具調用與環境反饋循環,標準 Transformer 必須反覆載入模型權重並重新計算鍵值緩存,造成大量 GPU 記憶體頻寬浪費。這種「重複開銷」在實務上限制了系統的擴展性,也使得部署成本居高不下。PHOTON 框架正是針對這一痛點設計,從架構層面重新梳理了運算流程。
PHOTON 的核心突破在於其高效率低開銷的處理機制。不同於 Transformer 對每個請求獨立運算,PHOTON 透過共享中間狀態與跨請求注意力合併,大幅減少重複計算。根據富士通公布的測試結果,在典型的智能體協作場景(如多代理同步決策、反覆查詢資料庫)中,PHOTON 能以遠低於 Transformer 的 GPU 時鐘週期完成相同任務。475 倍的倍率並非誇張,而是真實反映了極端多 I/O 情境下的效能差距。這意味著原先需要數小時的批處理作業,現在可在數秒內完成,同時將 GPU 資源佔用降至最低。
從成本角度來看,PHOTON 的經濟效益極為明顯。由於降低了記憶體讀寫與運算單元的空轉比率,企業無需再大量採購高階 GPU 即可支撐同樣規模的智能體系統。富士通指出,這項框架能讓原本受限於硬體成本的 AI 應用變得可行,例如即時客戶服務、自動化程式編寫、或複雜的供應鏈模擬。特別是在需要同時處理成千上萬並發查詢的雲端環境中,PHOTON 的節省效果將呈指數級放大,從根本上改變 AI 服務的定價模式與部署策略。
PHOTON 的設計理念也反映了業界對算效比的重新審視。過去幾年,模型規模競賽主導了研究方向,但隨著參數量突破兆級,工程師開始發現單純擴張並不能解決所有問題;反而是如何讓有限運算資源產出更多有效結果變得更加關鍵。PHOTON 證明,在特定但重要的場景中,架構優化帶來的增益遠超參數增長。這很可能會推動更多團隊投入「輕量高效架構」的研發,進而催生一批專門服務於智能體生態的專用硬體與軟體棧。
展望未來,PHOTON 框架的應用前景十分廣闊。除了智能體系統,凡是涉及大量短查詢、頻繁 I/O 切換的場景,如邊緣運算中的感測器融合、金融交易中的即時風險計算、或遊戲 AI 中的 NPC 集體行為模擬,都可從中受益。富士通也計劃將 PHOTON 開源,並與雲端服務商合作提供最佳化版本。若該框架能順利普及,不僅能加速各產業的智慧化轉型,更有望讓中小企業以更低門檻享受到高效 AI 的紅利,從而帶動整個數位生態的進化。
總而言之,PHOTON 的問世並非僅僅是一次性能突破,更是對主流計算範式的重新詮釋。它提醒我們在追求模型規模的同時,不應忽略系統級效率的重要性。475 倍的倍率背後,是對記憶體層級、計算排程與工作量特性的深刻洞察。隨著智能體時代的到來,類似 PHOTON 的架構創新將成為支撐下一代 AI 應用的關鍵基礎。富士通此次的貢獻,不僅為自身贏得技術話語權,也為整個行業指出一條兼顧效能與經濟性的永續發展路徑。
Related
相關文章

WAIC UP!|AI圈都在聊參數,我們偏不
這篇消息聚焦「WAIC UP!|AI圈都在聊參數,我們偏不」。原始導語提到:7月17-7月20 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

首個長程Doc2Repo訓練集,代碼Agent不止修bug,開始造倉庫
DeNovoSWE是一個用於訓練代碼智能體從零生成完整倉庫的數據集,包含4818個真實任務實例。它通過結構化文檔和嚴格驗證機制,幫助智能體掌握複雜系統構建能力,而不僅僅是修復代碼。這為代碼智能體邁向更高階的軟件工程任務提供了關鍵支持。

4秒出百萬面!突破千萬面精度+12K高清貼圖,手握數億的3D生成公司下一局怎麼打?
這篇消息聚焦「4秒出百萬面!突破千萬面精度+12K高清貼圖,手握數億的3D生成公司下一局怎麼打?」。原始導語提到:3D生成領域的Anthropic 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

消息稱商湯科技正研發新圖像模型:代號 U1 Pro,內部稱對標 OpenAI
這篇消息聚焦「消息稱商湯科技正研發新圖像模型:代號 U1 Pro,內部稱對標 OpenAI」。原始導語提到:目前,該模型在內部代號為“U1 Pro”,由商湯研究院推進研發,屬於商湯日日新模型家族成員。預計今年 7 月該模型將啟動內部邀請測試,並向客戶提供服務。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

百度開源 Unlimited OCR 模型:基於 DeepSeek OCR,解析文檔告別 AI 越生成越慢
百度於 6 月 22 日開源推出 Unlimited OCR 模型,總參數量 30 億,推理時僅激活 5 億參數,目標解決在解析長文檔時,端到端 OCR 模型越生成越慢的問題。

AI軟遞歸自我提升,Hassabis夜不能寐:人類已至奇點山腳
這篇消息聚焦「AI軟遞歸自我提升,Hassabis夜不能寐:人類已至奇點山腳」。原始導語提到:軟遞歸自我提升已實現,哈薩比斯夜不能寐! 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。