算力荒,但Token卻便宜了,智算雲的賬該怎麼算?

2026年6月24日 13:08
算力荒,但Token卻便宜了,智算雲的賬該怎麼算?

重點摘要

這篇消息聚焦「算力荒,但Token卻便宜了,智算雲的賬該怎麼算?」。原始導語提到:當前以超低價爭奪用戶的模式,長期來看可持續性存疑。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

站內 AI 整理稿

當前人工智能領域正面臨一個看似矛盾的現象:一方面,高端算力資源(如H100、A100等GPU)的供給持續緊張,被稱為「算力荒」;另一方面,主流雲服務商提供的Token(即大模型調用或推理的計價單位)價格卻不斷走低,甚至降至接近成本的邊緣。這種「冰火兩重天」的局面,讓智算雲(智能計算雲)的商業模式顯得格外尷尬。算力荒意味著採購成本高企,而Token降價則擠壓了收入空間,一進一出之間,雲廠商如何算得過來這筆賬,成了行業必須正視的核心問題。

算力荒的根源在於生成式AI的爆發式需求與上游晶片產能瓶頸之間的錯配。訓練和推理大模型需要海量GPU算力,而供應鏈受限導致租賃價格居高不下。許多智算雲不得不高價搶購稀缺資源,甚至通過長期合同鎖定供應,固定成本壓力巨大。與此同時,市場上的雲服務商為了爭奪客戶份額,卻紛紛下調模型調用價格,甚至推出按量計費的「白菜價」Token,試圖以低價策略搶佔先機。這種做法短期內確實能吸引開發者和企業,但從財務角度看,很可能是在「賣一單虧一單」。

Token之所以變便宜,除了競爭因素,還有技術層面的原因。模型蒸餾、量化、推理引擎優化等手段不斷降低單次調用的計算成本,使得單位Token的邊際成本下降。然而,這些優化的紅利還沒有完全攤平高昂的算力基礎設施建設投入。更重要的是,低價模式的本質是雲廠商希望通過「以本傷人」建立用戶黏性,將來再通過增值服務、模型訓練或數據管理來變現。但問題在於,如果基礎推理業務長期虧損,而增值服務又未能形成規模,整個商業循環就會陷入被動。

這種「燒錢換市場」的做法,與互聯網時代的補貼戰有相似之處,但智算雲的資源門檻遠高於傳統軟件服務。GPU集群的建設需要鉅額資本支出,電費和運維成本同樣不容忽視。一旦低價競爭引發價格戰,又無法通過規模效應快速攤薄成本,雲廠商的現金流壓力會急劇增大。尤其是中小型智算雲服務商,既沒有自研晶片的能力,也難以與巨頭拼折扣,很容易在算力荒與低價雙重夾擊下被淘汰出局。

那麼,智算雲的賬該怎麼算?首先,定價策略需要回歸成本結構,不能再脫離實際算力成本去定Token價格。其次,應通過動態調度、混合雲部署、專屬實例等技術手段提升GPU利用率,把閒置資源盤活,從而降低單位成本。再者,可以借鑒傳統雲計算的「包年包月」與「按

Related

相關文章

再幹十年以上,軟銀孫正義為 AI 改變退休計劃

68 歲的軟銀創始人孫正義宣佈,將放棄原定的退休計劃,繼續執掌公司至少 10 年,以全力推動 AI 技術普及,並將軟銀打造成全球領先的 AI 機器人企業。他透露已調整公司 50 年發展規劃,並正通過投資 OpenAI、收購 ABB 機器人部門等方式加速佈局。#AI# #軟銀#

剛剛

剛剛,豆包宣佈收費

這篇消息聚焦「剛剛,豆包宣佈收費」。原始導語提到:就算只有1%豆包用戶訂閱,每月也能收入至少2.28億。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛

突發!阿里起訴美國國防部

這篇消息聚焦「突發!阿里起訴美國國防部」。原始導語提到:百度、比亞迪也在黑名單中。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛