谷歌全面擴容 Gemini API 免費額度:部分模型單分鐘吞吐量翻至百萬級
重點摘要
谷歌大幅上調Gemini API免費配額,部分賬號的Gemini 2.5 Flash及Flash-Lite輕量化模型每分鐘Token處理上限提升至100萬,已率先實施,降低開發者調用成本,凸顯算力競爭。
谷歌近日宣布全面擴容 Gemini API 的免費使用額度,其中最受矚目的調整集中在旗下輕量化模型——Gemini 2.5 Flash 與 Flash-Lite 上。根據最新政策,部分帳戶的每分鐘 Token 處理上限已大幅拉升至百萬級規模,並且這項調整已經率先上路。這項變動不僅直接降低了開發者調用 API 的門檻與成本,也反映出谷歌在生成式 AI 算力競賽中持續加碼的意圖。
從背景脈絡來看,Gemini 系列是谷歌對抗 OpenAI、Meta 等對手的主力產品,而 Flash 與 Flash-Lite 這類輕量化模型,正是專為高頻、低延遲的即時應用場景所設計。過去免費額度相對有限,開發者若要進行大規模測試或部署,往往需要申請付費方案,或是被迫降低呼叫頻率。此次將吞吐量上限推升至百萬級,意味著即使是小型團隊或個人開發者,也有機會在一分鐘內處理數十萬甚至上百萬個 Token,這對聊天機器人、內容摘要、客服系統等即時回應需求的專案來說,是一項極具吸引力的變革。
這項調整可能帶來的影響層面相當廣泛。首先,對獨立開發者與新創團隊而言,免費額度的擴容等同於降低了試驗成本,讓他們能在不負擔高額 API 費用的情況下,快速驗證產品概念或進行原型開發。其次,對於教學或研究單位來說,更充沛的免費資源有助於推動 AI 教育的普及,學生與研究人員可以更頻繁地進行實驗,而不必擔心帳單超支。此外,這也意味著谷歌正在有意識地透過「免費配額」策略來吸引更多開發者生態系統,讓 Gemini API 在市場上擁有更高的黏著度,進而與 OpenAI 的 GPT API、Anthropic 的 Claude API 等競爭對手搶奪開發者注意力。
然而,免費額度的擴張並非沒有潛在挑戰。算力競爭本質上是資本與基礎設施的廝殺,谷歌短期內願意讓利,背後必定有商業算計。一方面,此舉可能加速其他雲端 AI 服務的價格戰,迫使對手跟進調降收費或提高免費額度,最終讓開發者成為最大贏家。另一方面,免費資源雖然看似慷慨,但實際上可能附帶使用限制—例如每日總呼叫次數、模型回應速度的優先級差異,或是在流量尖峰時段被降權處理。開發者若未仔細閱讀使用條款,很容易在專案上線後才發現隱形成本。
讀者可以持續關注的後續動向包括:首先,其他大型語言模型(如 Gemini Ultra 或 Gemini Pro)是否也會跟進調高免費額度?其次,谷歌是否會同步調整付費方案的計價結構,讓開發者在免費額度用完後的轉換更為平滑?再者,OpenAI、微軟 Azure OpenAI 服務以及亞馬遜 Bedrock 等平台,預料也會在近期提出相應的對策,例如暫時性促銷或提高免費試用上限。最後,值得留意的是這項擴容政策是否僅限特定地區或特定類型的開發者帳號,未來會不會有地域性的推行差異。
總結來說,谷歌這波 Gemini API 免費額度擴容,是一次典型的「以量換市」策略。它藉由降低使用門檻,吸引更多開發者進入谷歌 AI 生態系,同時也在算力軍備競賽中搶佔先機。對於正在評估 AI API 選擇的團隊而言,現在正是重新比較各家服務性價比的好時機。後續若能在穩定度、回應速度以及模型表現上持續優化,Gemini 系列有機會在輕量化模型領域取得更具優勢的市場地位。
Related
相關文章

AI 版支付寶開放公測,螞蟻阿寶無需邀請碼即可體驗
這篇消息聚焦「AI 版支付寶開放公測,螞蟻阿寶無需邀請碼即可體驗」。原始導語提到:支付寶今日官宣,阿寶 AI 助手正式開放公測: iOS 和安卓系統用戶在應用商店或支付寶 App,直接搜「阿寶」或「螞蟻阿寶」就能體驗。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

華擎推出 ASRock Claw Quickset 桌面工具,可簡化本地 AI 環境部署
華擎推出 ASRock Claw Quickset 桌面工具,能自動完成 OpenClaw、AI 模型及必要軟體元件的安裝與設定,大幅簡化本地 AI 環境的部署流程。用戶可在短時間內快速開始與 AI 進行互動。
拒絕內卷式協作:崑崙萬維天工 3.2 推出 Skywork Tags,讓 AI 成為工作群裡的“靠譜同事”
崑崙萬維發佈天工3.2版,推出Skywork Tags功能,針對頻繁切換窗口搬運數據導致效率下降的痛點。其核心邏輯是不改變團隊既有協作流程,直接將AI智能體接入Slack、飛書、釘釘、Discord、Telegram等現有辦公群組,讓智能體無縫融入工作場景。
告別“一刀切”:Cloudflare 推出精細化 AI 流量管理,築起網站變現護城河
網站主面臨AI爬蟲氾濫的兩難:既要搜索流量,又恐內容被竊或廣告被擾。7月1日,Cloudflare推出AI流量管理工具,支持站長按爬蟲類型精細化管控,打破了過去“一刀切”式屏蔽的侷限,在保留搜索引擎曝光的同時,有效防止數據濫用。
支付寶AI生活助理“阿寶”正式開啟公測,全面取消邀請碼限制
支付寶AI生活助理“阿寶”7月2日全面開放公測,iOS與安卓用戶無需邀請碼即可直接體驗。該應用經過一個月內測迭代,正式進入規模化市場檢驗,公測版重點展示其在生活場景的服務能力。

Karpathy又封神,掀翻RAG,把你的筆記變成第二大腦
知識第一次,能像代碼一樣利滾利。前OpenA 創始團隊成員、特斯拉前 AI 高級總監 Andrej Karpathy,提出一個狠招:別再用 RAG 檢索你的知識庫,讓大模型把它「編譯」成一座持續生長的活 Wiki。兩個多月,他在GitHub屠出 5000+ star。