F5中國本土創新“出圈”,自研Token負載均衡讓異構GPU集群併發提升75%
重點摘要
在日前舉行的F5 Solution Day 2026媒體發佈會上,F5中國正式推出本地化的基於詞元的負載均衡解決方案,旨在解決AI推理場景下異構算力調度效率低、GPU資源利用率不均等核心痛點。在某運營商採用華為Ascend 910B算力的環境中,併發用戶數提升至少75%,Token生成速度提升達99%。“創新中國,鏈接全球”的雙引擎戰略在戰略層面,F5中國今年將發展理念從“創新中國,服務中國”升級為“創新中國,鏈接全球”。
## F5 中国原生创新再下一城,Token 感知负载均衡让异构 GPU 集群并发大增至 75%
全球应用交付与安全领导厂商 F5 正加速将创新重心移向东方。在日前落幕的 F5 Solution Day 2026 媒体发布会上,F5 中国宣布正式推出本土自主研发的「基于词元的负载均衡解决方案」(Token Based Load Balancing,TBLB),为 AI 推理场景下长期困扰产业的异构算力调度效率低下、GPU 资源利用率不均等痛点,提供了一记精准而有力的回击。
### 算力调度新解方,从「请求本位」到「Token 感知」
随着 DeepSeek、Qwen 等大型语言模型全面进入企业核心生产环境,模型从展示走向真实调用,算力过载、服务中断以及高并发下的延迟波动日益成为制约 AI 规模化落地的关键变量。尤其是在中国市场,企业普遍面临国产与进口芯片(如华为 Ascend 系列与 NVIDIA GPU)异构部署的现实挑战。不同的计算架构、适配程度不均的推理框架,以及算力节点间的结构性性能落差,使得传统负载均衡方案——以「请求数」为核心的分发逻辑——显得力不从心。
F5 中国推出的 TBLB 方案,恰是直指这一深层矛盾。该方案不再以粗颗粒的请求数为调度单位,而是以词元(Token)数量及其对应的计算成本为基准,将不同长度、不同复杂度的推理任务精细化地分配至最适合的算力节点,从源头上避免资源空转与局部过载。
### 动态感知、实时调度,打破异构芯片资源壁垒
TBLB 方案的技术灵魂,在于其引入的「Token 感知与 GPU 动态压力自适应调度机制」。该方案在运行过程中会综合评估多项关键指标,包括推理任务的 Token 规模、GPU 实时负载与利用率、任务队列长度、KV Cache 使用情况乃至实例健康状态,并据此动态调整算力调度策略。这套机制将原本杂乱无章、难以预测的推理流量,转化为可感知、可量化、可精密编排的算力资源。
在运营商的实际测试环境中,这一新方案展现出了惊人的成效。在采用华为 Ascend 910B 算力的集群中,TBLB 方案使并发用户数从 400 大幅提升至 700,增幅高达 75%,同时 Token 生成速度提升达 99%,端到端时延则从 20 秒骤降至 180 毫秒。这一数据背后的深层意义在于:在不增加任何 GPU 硬件投入的前提下,企业长期被闲置或浪费的隐形算力被真正「变现」为可触达的业务容量。
### 从「创新中国」到「链接全球」,双引擎战略再升级
此次 TBLB 方案的推出,不仅是一次技术上的原生创新,更承载着 F5 中国战略定位的重大跃迁。在发布会现场,F5 中国宣布将过去「创新中国,服务中国」的本土化发展理念,升级为全新的「创新中国,链接全球」双引擎战略。
这一战略转向背后,是中国 AI 产业生态正在经历的深刻蜕变。截至 2026 年,中国境内日均 Token 调用量已突破 140 万亿,百倍级的爆发式增长意味着 AI 应用正从概念验证大步走向真实的生产环境与业务闭环。未来,F5 中国不仅要帮助国内企业在异构算力环境下确保推理服务「更快、更省、更承压」,更意图将在中国土壤上打磨出的技术成果与最佳实践,向外辐射、反向赋能全球市场。
### 对台湾市场的影响与产业启示
回到台湾本地视角,F5 近年在新竹以北的布局也可谓步步为营。2025 年,F5 不仅已在台湾正式发表全新一代「Application Delivery and Security Platform」(ADSP),更延揽拥有逾 20 年 IT 产业资历的林志方担任台湾区总经理,深化云端资安与 AI 驱动应用交付的在地服务能量。
随着台湾产业快速迈向智慧制造、数位金融与 5G/6G 次世代联网,企业 IT 团队面对的早已不仅是传统负载均衡,而是如何在混合多云环境中同时兼顾效能、安全与合规。结合母公司 F5 在 ADC 3.0 时代的 AI 化平台愿景,TBLB 方案中所展现的 AI 推理网关架构,极有可能在不久的将来通过跨境技术协同,为台湾的半导体、电子制造及金融服务业提供更细颗粒、更低延时的算力调度体验。
### 讀者後續關注重點
對於關注 AI 基礎設施與企業數位轉型的讀者而言,以下幾個動向值得持續追蹤:其一,**F5 TBLB 方案是否會逐步整合至 F5 ADSP 平台並引入台灣市場**,這將直接影響本地企業在異構 GPU 部署上的運維效率;其二,**「創新中國,鏈接全球」雙引擎戰略的實質落地成果**,尤其是在跨國企業的 AI 推理業務場景中是否展現出明顯的競爭優勢;其三,**異構算力調度技術的標準化與開源生態發展**,包括 F5 在 CNCF 黃金會員身份下對相關領域的技術貢獻,可能為企業自建 AI 平台提供新的基礎元件與最佳實踐。
AI 時代的算力競賽早已不是單純比拚晶片數量,誰能在異構、混雜、高動態的基礎設施中做到極致的調度效率,誰才能真正握住解鎖商業價值的鑰匙。F5 這步「Token 感知」棋,正在翻開一個全新的篇章。
用户DEEP_SEARCH需要一篇关于F5中国新发布的Token负载均衡解决方案的原创整理稿,内容要求包括重点整理、背景、影响和后续关注。要写好这篇,除了用户提供的发布会核心信息,还需要补充F5公司的背景、AI算力调度的行业现状、技术细节以及在中国市场的战略布局。这几个方面跨度挺大,分开搜索效率更高,可以同时获取基础信息、行业背景和技术细节。FINISHED回来了。关于F5公司的信息比较充分,有几篇媒体文章和官网介绍可以了解其背景、在台湾的市场活动以及最新的ADSP平台。关于AI算力调度的搜索结果也显示,异构算力调度确实是当前AI基础设施的难点。最关键的是,有两篇专门介绍F5中国这个“Token负载均衡”方案的报道,一篇是CSDN博客,一篇是TechWeb,内容应该最接近用户提供的标题和原文。现在打开这几篇关键文章,获取详细的技术细节和战略描述。FINISHEDFINISHEDFINISHEDFINISHEDFINISHEDFINISHEDFINISHEDFINISHEDFINISHEDFINISHEDToken负载均衡方案的几篇文章提供了足够的技术细节和实测数据,F5在台湾的市场活动也有多篇报道作为背景。稿件可以围绕异构算力调度这一核心痛点展开,从传统方法的局限讲到TBLB方案的自适应调度机制,再用具体场景下的性能提升数据说明其价值,最后落到F5升级的“创新中国,链接全球”战略和对台湾市场的可能影响上。
Related
相關文章

Token成本算盤打響,Seedance開始駛向“五環外”
這篇消息聚焦「Token成本算盤打響,Seedance開始駛向“五環外”」。原始導語提到:視頻AI的決勝場,不在模型本身。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

Pixel 10 手機用戶反饋谷歌 AI“搶鏡”問題,Gmail 無法正常回復郵件
科技媒體 Android Authority 昨日(6 月 18 日)發佈博文,報道稱 Pixel 10 系列手機遭遇 AI“搶鏡”問題,用戶在 Gmail 回覆郵件時無法彈出輸入法鍵盤,優先顯示 Help me write 功能。

DeepSeek 識圖模式正式上線 App 和網頁端
DeepSeek 多模態研究員 Xiaokang Chen 今日表示,DeepSeek 的識圖模式已在網頁和 App 端正式上線。IT之家測試,目前 DeepSeek 的 App 端識圖模式依然提示“圖片理解功能內測中”,網頁端沒有這項提示。

微信、豆包之後,消息稱阿里將推“千問輸入法”
千問團隊將推出名為“千問輸入法”的獨立 App,與 PC 端的千問語音輸入法有一定區別,AI 功能、鍵盤會更貼合手機端操作,填補千問在移動端 AI 輸入法賽道的空白,產品已開發完成,擇日上線各大應用商店。
Kimi Work 迎重大升級:推出“目標模式”並打通外部應用插件
月之暗面旗下 Kimi 電腦客戶端近日煥新升級,為 Kimi Work(Beta 版)引入兩項重磅新特性:目標模式實現連續自主工作 24 小時,插件中心正式對接多家主流辦公軟件,提升工作流效率。為加速用戶深度體驗,官方同步推出限時優惠,2026 年 6 月全月,使用 Work 模式的會員額度消耗直接打 5 折,帶來實惠。
網易雲音樂旗下AI情感陪伴App“妙時”宣佈7月14日停運
網易雲音樂旗下“妙時”(含AI奇遇)AI情感陪伴應用發佈停運公告,將於7月14日0時全面停止服務。客服迴應屬正常業務調整,不影響其他產品。目前已停止新用戶註冊和充值,用戶可在8月14日前申請退還剩餘代幣和會員費,並導出AI戀人聊天記錄。