視頻版Nano Banana來了！內置Gemini世界知識；原版香蕉出圖僅需4秒

2026年7月1日 09:21

重點摘要

Google推出視頻版Nano Banana，內建Gemini世界知識功能。原版香蕉模型生成圖像僅需4秒，效能顯著提升。目前Gemini 3.5 Pro的發布時間尚未公布。

站內 AI 整理稿

### 視頻版 Nano Banana 來了！內置 Gemini 世界知識；原版香蕉出圖僅需 4 秒

近期在 AI 生成領域引起話題的「Nano Banana」系列，正式推出視頻版本。不同於先前的靜態圖像生成，這款新工具號稱融入了 Google Gemini 的世界知識，讓生成的動態內容更具邏輯與真實感。與此同時，原版「香蕉」模型在圖像生成速度上也有驚人表現——從輸入提示詞到產出成品，僅需 4 秒鐘，效率遠超許多同級工具。

#### 重點整理：視頻生成與知識注入

根據目前流出的資訊，視頻版 Nano Banana 最關鍵的升級在於「內置 Gemini 世界知識」。這意味著模型不再只是單純地將像素拼接成動畫，而是能夠理解場景中的物體關係、物理規律與文化背景。例如，當使用者要求生成「一個人在雨中撐傘行走」，系統會自動判斷雨滴方向、傘的形狀以及腳步的節奏，避免出現不合邏輯的錯位。此外，原版 Banana 的 4 秒出圖速度，也為即時創作與迭代提供了極大便利，適合需要快速驗證靈感的設計師或內容創作者。

#### 背景脈絡：從圖像到視頻的演進

「Nano Banana」這一名稱最早出現在社群媒體上的技術展示，起初僅支援靜態圖像生成，主打輕量級、低延遲。隨著 Google 持續更新 Gemini 模型家族，該系列工具開始獲得更多多模態能力。事實上，Gemini 本身即內建文字、圖像、音訊與影片的理解與生成功能，而 Nano Banana 正是將這些能力濃縮在一個更小、更快的架構中。此次推出視頻版，等於補齊了動態創作的最後一塊拼圖，也呼應了業界從「文本到圖像」轉向「文本到影片」的趨勢。

#### 可能影響：創作門檻再降低，但版權爭議待解

對一般使用者而言，能以接近即時的速度生成高品質短片，將大幅降低影片製作的技術門檻。無論是社群媒體上的短影音、行銷素材，甚至是教育解說動畫，都可能因為這類工具而變得更加普及。然而，世界知識的注入也帶來隱憂：模型若過度依賴既有資料庫中的偏見或錯誤資訊，可能生成帶有刻板印象的內容。此外，生成的影片若模仿特定藝術家風格或未經授權的素材，版權問題仍是懸而未決的炸彈。

#### 讀者可關注的後續：Gemini 3.5 Pro 何時登場？

有趣的是，在消息發布的同時，社群上也不斷出現「Gemini 3.5 Pro 到底什麼時候來」的呼聲。這反映出用戶對更高階多模態模型的渴望——畢竟視頻版 Nano Banana 雖然快速，但解析度與時間長度仍有明顯限制。未來若 Gemini 3.5 Pro 正式推出，很可能進一步解鎖更長片段、更高畫質的生成能力，甚至支援即時互動式影片編輯。建議讀者持續追蹤 Google 的下一次開發者大會或官方部落格更新，同時留意第三方開發者如何運用 Nano Banana 的 API 打造創新應用。

#### 結語：速度與知識的雙重革命

從 4 秒出圖到內建世界知識的視頻生成，Nano Banana 系列證明了輕量級模型也能承載複雜的推理與創造力。雖然目前仍處於早期階段，但這項技術已為內容生產流程帶來根本性的效率提升。對於台灣的創作者與科技愛好者而言，值得親自試用這類工具，並思考如何在倫理與法律框架下，善用 AI 所帶來的創作紅利。

原始來源：量子位 ↗

查看原始來源