時隔4個月，谷歌Nano Banana再發新模型

2026年7月1日 02:52

重點摘要

谷歌於7月1日開放兩款新AI模型：圖像生成模型Nano Banana 2 Lite及視頻生成編輯模型Gemini Omni Flash。Nano Banana 2 Lite主打近即時、高性價比，單張1K圖像延遲約4秒、價格0.034美元起，被推薦為初代Nano Banana的替代方案；Gemini Omni Flash則首次公開預覽，支援文本、圖像和影片輸入，可用自然語言進行多輪影片編輯，目前支援10秒影片生成，每秒輸出價格0.10美元。兩款模型現已登陸Google AI Studio、Gemini API等平台，評測顯示Gemini Omni Flash在影片編輯的整體偏好與指令遵循上均領先同類模型。

站內 AI 整理稿

智東西編譯 | 楊京麗編輯 | 李水青智東西7月1日消息，今天，谷歌宣佈開放兩款新模型：圖像生成模型Nano Banana 2 Lite和視頻生成編輯模型Gemini Omni Flash。 ▲谷歌推出Nano Banana 2 Lite和Gemini Omni Flash（圖源：X）今年2月，谷歌推出Nano Banana 2，在保持較低延遲的同時提升圖像生成質量，支持更強的推理能力和搜索能力。今年5月，谷歌在I/O大會上首次展示Gemini Omni Flash，定位為原生多模態的視頻生成編輯模型，但當時並未向開發者開放。此次更新的模型Nano Banana 2 Lite是初代Nano Banana的推薦替代模型，主打近實時、較高質量圖像生成，單張1K分辨率圖像生成延遲約4秒、價格0.034美元（約合人民幣0.23元）起；Gemini Omni Flash則首次面向開發者公開預覽，支持文本、圖像和視頻輸入，可用自然語言進行多輪視頻編輯，目前支持10秒視頻生成，視頻輸出價格為每秒0.10美元（約合人民幣0.68元）。評測結果顯示，Nano Banana 2 Lite在圖像生成和圖像編輯Elo分數上略低於Nano Banana 2，但速度更快，成本更低；Gemini Omni Flash在視頻編輯模型對比中，整體偏好和指令遵循兩項Elo評分均位列第一，領先HappyHorse、Kling v3 Pro、Seedance 2.0等模型。兩款模型現已登陸Google AI Studio、Gemini API和Gemini Enterprise Agent Platform，其中Gemini Omni Flash還可在Gemini app和Google Flow中使用。此次更新後，用戶可以先用Nano Banana 2 Lite快速生成圖像，再通過Gemini Omni Flash將靜態圖像轉化為可繼續編輯的視頻內容。谷歌還推出了Anywhere、Space Lift、Omni Product Studio等演示應用，展示從自拍換地標、室內設計預覽到電商視頻生成等圖像到視頻工作流。一、Nano Banana 2 Lite替代初代模型，速度快性價比高谷歌稱，Nano Banana 2 Lite（gemini-3.1-flash-lite-image）是當前使用初代Nano Banana（gemini-2.5-flash-image）的推薦替代模型，在圖像質量、生成速度和成本等維度都有明顯提升。雖然該模型優先強調速度，谷歌仍稱其保留了較穩定的提示詞遵循能力、角色一致性和圖中文字渲染能力。谷歌列出了Nano Banana 2、Nano Banana 2 Lite與多款競品AI圖像模型的性能對比，評估維度包括圖像生成和圖像編輯的Elo分數、單張1K分辨率圖像的生成延遲，以及對應價格。 ▲Nano Banana 2 Lite與其他圖像生成模型評測對比（圖源：谷歌） Nano Banana 2 Lite圖像生成Elo分數為1251，略低於Nano Banana 2的1270，高於Flux 2 Klein 9B、Grok Imagine Image和Seedream v5 Lite等對照模型；在圖像編輯上，Nano Banana 2 Lite得分為1308，在對照模型中位列中等水平。速度和成本是Nano Banana 2 Lite最突出的優勢。生成一張1K分辨率圖像的延遲約為4.0秒，明顯快於Nano Banana、Nano Banana 2和Seedream v5 Lite等模型。價格方面，Nano Banana 2 Lite每張1K圖像約0.034美元（約合人民幣0.23元）起，成本低於谷歌其他圖像模型，價格與Seedream v5 Lite的0.035美元（約合人民幣0.24元）接近，高於Flux 2 Klein 9B、Grok Imagine Image。

原始來源：智東西 ↗

查看原始來源

36氪生成式AI

Claude Fable 5，名存實亡

assistant: 根據提供的內容，這似乎是一則關於AI模型服務的報導或評論。摘要如下：Claude的Fable 5模型在更新後性能大幅下滑，跑分結果出現斷崖式下跌。官方文檔揭露，用戶在付費使用Fable 5的過程中，實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。</think>Claude的Fable 5模型在更新後性能大幅下滑，跑分結果出現斷崖式下跌。官方文檔揭露，用戶在付費使用Fable 5的過程中，實際運行的可能一直是舊版的Opus模型。此事件引發了對模型服務透明度的質疑。

剛剛閱讀分析

智東西生成式AI

對話Kimi B端負責人黃震昕：把國產大模型搬上亞馬遜雲科技，未來與海外“御三家”掰手腕

月之暗面Kimi與亞馬遜雲科技展開四層合作，涵蓋基礎設施、平台服務、業務合作及垂直行業，藉此拓展全球市場。Kimi B端負責人黃震昕透露，公司提供業界最高人均算力，B端業務快速增長，並在Token效率、長程推理及Agent集群等方面取得技術突破，目標是與海外頂尖模型競爭。他預測，雖然算力成本上漲推升模型價格，但技術優化將持續提升性價比。

5 小時前閱讀分析

雷峰網生成式AI

算力之外的博弈：ICML 2026 透露了哪些學術硬通貨？

告別盲目刷榜，28頁 PPT 帶你摸透 ICML 新風向。作者丨陳淑瑜編輯丨岑峰 ICML 2026 的投稿量從去年的 12107 篇直接飆升至 23,918 篇，幾近翻倍。然而，最終的接收率卻牢牢釘在 26.56%，與去年幾乎持平。這一數據傳遞出一個明確的信號：並非競爭變得盲目激烈，而是學術評審標準經歷了一次深刻的“重新校準”。

6 小時前閱讀分析

智東西生成式AI

獨家：阿里全面禁用Claude

智東西作者 | 李水青編輯 | 雲鵬智東西7月3日獨家獲悉，今日，阿里巴巴內部宣佈反向禁用Claude。阿里全員被要求卸載Anthropic相關產品，包括Sonnet、Opus、Fable等多個系列模型，以及Claude Code在內的Agent產品。禁令於7月10日正式生效。

8 小時前閱讀分析

智東西生成式AI

超190億！AI視頻最大單筆融資誕生，阿里騰訊百度都投了

快手旗下AI視頻生成業務「可靈AI」完成190.48億元融資，阿里、騰訊、百度均參與投資，快手持股比例降至約68.33%。可靈AI自2024年6月上線以來已更新30多次，2025年營收約11億元，年化收入運行率達5億美元。快手同時宣布首次授予員工股權獎勵，並計劃在未來12個月內推動可靈AI赴港上市。

11 小時前閱讀分析

MarkTechPost AI生成式AI

RAG-Anything 教學：在 Colab 中建立支援文字、表格、方程式與圖像的多模態檢索管道

本教學示範如何在 Google Colab 中建立 RAG-Anything 多模態檢索管道，支援文字、表格、方程式與圖像。流程包括安裝依賴、設定 OpenAI API、建立合成多模態報告與 PDF，並測試 naive、local、global 與 hybrid 等不同檢索模式。最終實現從內容列表格式插入資料，並透過多模態嵌入與視覺功能進行靈活檢索。

15 小時前閱讀分析

相關文章

Claude Fable 5，名存實亡

對話Kimi B端負責人黃震昕：把國產大模型搬上亞馬遜雲科技，未來與海外“御三家”掰手腕

算力之外的博弈：ICML 2026 透露了哪些學術硬通貨？

獨家：阿里全面禁用Claude

超190億！AI視頻最大單筆融資誕生，阿里騰訊百度都投了

RAG-Anything 教學：在 Colab 中建立支援文字、表格、方程式與圖像的多模態檢索管道