智東西生成式AI

時隔4個月,谷歌Nano Banana再發新模型

2026年7月1日 02:52

重點摘要

谷歌於7月1日開放兩款新AI模型:圖像生成模型Nano Banana 2 Lite及視頻生成編輯模型Gemini Omni Flash。Nano Banana 2 Lite主打近即時、高性價比,單張1K圖像延遲約4秒、價格0.034美元起,被推薦為初代Nano Banana的替代方案;Gemini Omni Flash則首次公開預覽,支援文本、圖像和影片輸入,可用自然語言進行多輪影片編輯,目前支援10秒影片生成,每秒輸出價格0.10美元。兩款模型現已登陸Google AI Studio、Gemini API等平台,評測顯示Gemini Omni Flash在影片編輯的整體偏好與指令遵循上均領先同類模型。

站內 AI 整理稿

智東西 編譯 | 楊京麗 編輯 | 李水青 智東西7月1日消息,今天,谷歌宣佈開放兩款新模型:圖像生成模型Nano Banana 2 Lite和視頻生成編輯模型Gemini Omni Flash。 ▲谷歌推出Nano Banana 2 Lite和Gemini Omni Flash(圖源:X) 今年2月,谷歌推出Nano Banana 2,在保持較低延遲的同時提升圖像生成質量,支持更強的推理能力和搜索能力。今年5月,谷歌在I/O大會上首次展示Gemini Omni Flash,定位為原生多模態的視頻生成編輯模型,但當時並未向開發者開放。 此次更新的模型Nano Banana 2 Lite是初代Nano Banana的推薦替代模型,主打近實時、較高質量圖像生成,單張1K分辨率圖像生成延遲約4秒、價格0.034美元(約合人民幣0.23元)起;Gemini Omni Flash則首次面向開發者公開預覽,支持文本、圖像和視頻輸入,可用自然語言進行多輪視頻編輯,目前支持10秒視頻生成,視頻輸出價格為每秒0.10美元(約合人民幣0.68元)。 評測結果顯示,Nano Banana 2 Lite在圖像生成和圖像編輯Elo分數上略低於Nano Banana 2,但速度更快,成本更低;Gemini Omni Flash在視頻編輯模型對比中,整體偏好和指令遵循兩項Elo評分均位列第一,領先HappyHorse、Kling v3 Pro、Seedance 2.0等模型。 兩款模型現已登陸Google AI Studio、Gemini API和Gemini Enterprise Agent Platform,其中Gemini Omni Flash還可在Gemini app和Google Flow中使用。 此次更新後,用戶可以先用Nano Banana 2 Lite快速生成圖像,再通過Gemini Omni Flash將靜態圖像轉化為可繼續編輯的視頻內容。谷歌還推出了Anywhere、Space Lift、Omni Product Studio等演示應用,展示從自拍換地標、室內設計預覽到電商視頻生成等圖像到視頻工作流。 一、Nano Banana 2 Lite替代初代模型,速度快性價比高 谷歌稱,Nano Banana 2 Lite(gemini-3.1-flash-lite-image)是當前使用初代Nano Banana(gemini-2.5-flash-image)的推薦替代模型,在圖像質量、生成速度和成本等維度都有明顯提升。 雖然該模型優先強調速度,谷歌仍稱其保留了較穩定的提示詞遵循能力、角色一致性和圖中文字渲染能力。谷歌列出了Nano Banana 2、Nano Banana 2 Lite與多款競品AI圖像模型的性能對比,評估維度包括圖像生成和圖像編輯的Elo分數、單張1K分辨率圖像的生成延遲,以及對應價格。 ▲Nano Banana 2 Lite與其他圖像生成模型評測對比(圖源:谷歌) Nano Banana 2 Lite圖像生成Elo分數為1251,略低於Nano Banana 2的1270,高於Flux 2 Klein 9B、Grok Imagine Image和Seedream v5 Lite等對照模型;在圖像編輯上,Nano Banana 2 Lite得分為1308,在對照模型中位列中等水平。 速度和成本是Nano Banana 2 Lite最突出的優勢。生成一張1K分辨率圖像的延遲約為4.0秒,明顯快於Nano Banana、Nano Banana 2和Seedream v5 Lite等模型。價格方面,Nano Banana 2 Lite每張1K圖像約0.034美元(約合人民幣0.23元)起,成本低於谷歌其他圖像模型,價格與Seedream v5 Lite的0.035美元(約合人民幣0.24元)接近,高於Flux 2 Klein 9B、Grok Imagine Image。

Related

相關文章

Claude Fable 5,名存實亡

assistant: 根據提供的內容,這似乎是一則關於AI模型服務的報導或評論。摘要如下:Claude的Fable 5模型在更新後性能大幅下滑,跑分結果出現斷崖式下跌。官方文檔揭露,用戶在付費使用Fable 5的過程中,實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。</think>Claude的Fable 5模型在更新後性能大幅下滑,跑分結果出現斷崖式下跌。官方文檔揭露,用戶在付費使用Fable 5的過程中,實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。

剛剛
智東西生成式AI

對話Kimi B端負責人黃震昕:把國產大模型搬上亞馬遜雲科技,未來與海外“御三家”掰手腕

月之暗面Kimi與亞馬遜雲科技展開四層合作,涵蓋基礎設施、平台服務、業務合作及垂直行業,藉此拓展全球市場。Kimi B端負責人黃震昕透露,公司提供業界最高人均算力,B端業務快速增長,並在Token效率、長程推理及Agent集群等方面取得技術突破,目標是與海外頂尖模型競爭。他預測,雖然算力成本上漲推升模型價格,但技術優化將持續提升性價比。

5 小時前
雷峰網生成式AI

算力之外的博弈:ICML 2026 透露了哪些學術硬通貨?

告別盲目刷榜,28頁 PPT 帶你摸透 ICML 新風向。 作者丨陳淑瑜 編輯丨岑峰 ICML 2026 的投稿量從去年的 12107 篇直接飆升至 23,918 篇,幾近翻倍。然而,最終的接收率卻牢牢釘在 26.56%,與去年幾乎持平。這一數據傳遞出一個明確的信號:並非競爭變得盲目激烈,而是學術評審標準經歷了一次深刻的“重新校準”。

6 小時前
智東西生成式AI

獨家:阿里全面禁用Claude

智東西 作者 | 李水青 編輯 | 雲鵬 智東西7月3日獨家獲悉,今日,阿里巴巴內部宣佈反向禁用Claude。阿里全員被要求卸載Anthropic相關產品,包括Sonnet、Opus、Fable等多個系列模型,以及Claude Code在內的Agent產品。禁令於7月10日正式生效。

8 小時前
智東西生成式AI

超190億!AI視頻最大單筆融資誕生,阿里騰訊百度都投了

快手旗下AI視頻生成業務「可靈AI」完成190.48億元融資,阿里、騰訊、百度均參與投資,快手持股比例降至約68.33%。可靈AI自2024年6月上線以來已更新30多次,2025年營收約11億元,年化收入運行率達5億美元。快手同時宣布首次授予員工股權獎勵,並計劃在未來12個月內推動可靈AI赴港上市。

11 小時前
MarkTechPost AI生成式AI

RAG-Anything 教學:在 Colab 中建立支援文字、表格、方程式與圖像的多模態檢索管道

本教學示範如何在 Google Colab 中建立 RAG-Anything 多模態檢索管道,支援文字、表格、方程式與圖像。流程包括安裝依賴、設定 OpenAI API、建立合成多模態報告與 PDF,並測試 naive、local、global 與 hybrid 等不同檢索模式。最終實現從內容列表格式插入資料,並透過多模態嵌入與視覺功能進行靈活檢索。

15 小時前