富士通介紹 PHOTON 框架：1.2B 模型多查詢性能 475 倍於 Transformer

2026年6月25日 17:59

重點摘要

這篇消息聚焦「富士通介紹 PHOTON 框架：1.2B 模型多查詢性能 475 倍於 Transformer」。原始導語提到：PHOTON 能高效率低開銷地處理智能體系統等多 I/O 流程，從而降低 GPU 成本。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

富士通近日正式推出名為 PHOTON 的全新框架，並公開其驚人的性能數據：基於 1.2B 參數的模型在多查詢場景下，處理速度可達傳統 Transformer 的 475 倍。這一對比立即引發業界關注，因為 Transformer 架構是當前大語言模型與深度學習的主流基礎，但其在處理大量輸入輸出流程時卻存在明顯瓶頸。PHOTON 的出現，似乎為解決這一長期困擾提供了全新思路，特別是在智能體系統這類需要頻繁互動、多路並發的應用領域，可能帶來顛覆性變革。

傳統 Transformer 雖然在自然語言理解與生成上表現優異，但其自注意力機制的計算複雜度隨序列長度二次增長，導致批處理多條獨立查詢時效率急劇下降。尤其是面對智能體系統中常見的動態多輪對話、工具調用與環境反饋循環，標準 Transformer 必須反覆載入模型權重並重新計算鍵值緩存，造成大量 GPU 記憶體頻寬浪費。這種「重複開銷」在實務上限制了系統的擴展性，也使得部署成本居高不下。PHOTON 框架正是針對這一痛點設計，從架構層面重新梳理了運算流程。

PHOTON 的核心突破在於其高效率低開銷的處理機制。不同於 Transformer 對每個請求獨立運算，PHOTON 透過共享中間狀態與跨請求注意力合併，大幅減少重複計算。根據富士通公布的測試結果，在典型的智能體協作場景（如多代理同步決策、反覆查詢資料庫）中，PHOTON 能以遠低於 Transformer 的 GPU 時鐘週期完成相同任務。475 倍的倍率並非誇張，而是真實反映了極端多 I/O 情境下的效能差距。這意味著原先需要數小時的批處理作業，現在可在數秒內完成，同時將 GPU 資源佔用降至最低。

從成本角度來看，PHOTON 的經濟效益極為明顯。由於降低了記憶體讀寫與運算單元的空轉比率，企業無需再大量採購高階 GPU 即可支撐同樣規模的智能體系統。富士通指出，這項框架能讓原本受限於硬體成本的 AI 應用變得可行，例如即時客戶服務、自動化程式編寫、或複雜的供應鏈模擬。特別是在需要同時處理成千上萬並發查詢的雲端環境中，PHOTON 的節省效果將呈指數級放大，從根本上改變 AI 服務的定價模式與部署策略。

PHOTON 的設計理念也反映了業界對算效比的重新審視。過去幾年，模型規模競賽主導了研究方向，但隨著參數量突破兆級，工程師開始發現單純擴張並不能解決所有問題；反而是如何讓有限運算資源產出更多有效結果變得更加關鍵。PHOTON 證明，在特定但重要的場景中，架構優化帶來的增益遠超參數增長。這很可能會推動更多團隊投入「輕量高效架構」的研發，進而催生一批專門服務於智能體生態的專用硬體與軟體棧。

展望未來，PHOTON 框架的應用前景十分廣闊。除了智能體系統，凡是涉及大量短查詢、頻繁 I/O 切換的場景，如邊緣運算中的感測器融合、金融交易中的即時風險計算、或遊戲 AI 中的 NPC 集體行為模擬，都可從中受益。富士通也計劃將 PHOTON 開源，並與雲端服務商合作提供最佳化版本。若該框架能順利普及，不僅能加速各產業的智慧化轉型，更有望讓中小企業以更低門檻享受到高效 AI 的紅利，從而帶動整個數位生態的進化。

總而言之，PHOTON 的問世並非僅僅是一次性能突破，更是對主流計算範式的重新詮釋。它提醒我們在追求模型規模的同時，不應忽略系統級效率的重要性。475 倍的倍率背後，是對記憶體層級、計算排程與工作量特性的深刻洞察。隨著智能體時代的到來，類似 PHOTON 的架構創新將成為支撐下一代 AI 應用的關鍵基礎。富士通此次的貢獻，不僅為自身贏得技術話語權，也為整個行業指出一條兼顧效能與經濟性的永續發展路徑。

原始來源：IT之家 ↗

查看原始來源

量子位電腦視覺

WAIC UP!｜AI圈都在聊參數，我們偏不

這篇消息聚焦「WAIC UP!｜AI圈都在聊參數，我們偏不」。原始導語提到：7月17-7月20 從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

36氪電腦視覺

首個長程Doc2Repo訓練集，代碼Agent不止修bug，開始造倉庫

DeNovoSWE是一個用於訓練代碼智能體從零生成完整倉庫的數據集，包含4818個真實任務實例。它通過結構化文檔和嚴格驗證機制，幫助智能體掌握複雜系統構建能力，而不僅僅是修復代碼。這為代碼智能體邁向更高階的軟件工程任務提供了關鍵支持。

剛剛閱讀分析

量子位電腦視覺

4秒出百萬面！突破千萬面精度+12K高清貼圖，手握數億的3D生成公司下一局怎麼打？

這篇消息聚焦「4秒出百萬面！突破千萬面精度+12K高清貼圖，手握數億的3D生成公司下一局怎麼打？」。原始導語提到：3D生成領域的Anthropic 從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

IT之家電腦視覺

消息稱商湯科技正研發新圖像模型：代號 U1 Pro，內部稱對標 OpenAI

這篇消息聚焦「消息稱商湯科技正研發新圖像模型：代號 U1 Pro，內部稱對標 OpenAI」。原始導語提到：目前，該模型在內部代號為“U1 Pro”，由商湯研究院推進研發，屬於商湯日日新模型家族成員。預計今年 7 月該模型將啟動內部邀請測試，並向客戶提供服務。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析