IT之家生成式AI

為劇而生:生數 Vidu Q3 多模態大模型上線華為雲,主打文 / 圖生視頻一體化成片能力

2026年6月22日 21:26
為劇而生:生數 Vidu Q3 多模態大模型上線華為雲,主打文 / 圖生視頻一體化成片能力

重點摘要

據介紹,Vidu Q3 是全球首個「為劇而生」的視頻大模型,支持 16 秒聲畫同出、1080P 畫質,擁有穩定多鏡頭敘事與精準切鏡能力,並具備多國語言文字渲染及多語言輸出功能,可用於漫劇、短劇、影視劇等專業內容創作。

站內 AI 整理稿

**重點整理**

生數科技旗下多模態大模型 Vidu Q3 正式上線華為雲,主打「文生影片」與「圖生影片」一體化生成能力,並標榜為全球首個以「為劇而生」為定位的影片模型。該模型支援 16 秒長度、1080P 解析度,且能同步產出聲音與畫面;同時具備穩定多鏡頭敘事與精準切鏡技術,並內建多國語言文字渲染及多語言輸出功能,適用於漫劇、短劇、影視劇等專業內容創作場景。

**背景脈絡:從生成到敘事,影片 AI 的關鍵躍進**

過去一年,市面上多數影片生成模型(如 Runway、Pika 等)仍停留在「單鏡頭、短片段」階段,難以滿足連貫故事敘述的需求。Vidu Q3 的「多鏡頭敘事」與「切鏡精準度」正是為了解決這個痛點而設計,讓創作者不必靠後製手動拼接,就能產出具備基本導演技法的影片。此舉也反映出 AI 影片工具正從「生成素材」進化到「生成故事」,而華為雲作為底層算力平台,則為這類高強度運算需求提供穩定支撐。

**可能影響:降低專業創作門檻,加速短劇與漫劇量產**

對獨立創作者、小型工作室而言,Vidu Q3 的出現可能大幅縮短從腳本到成片的時間。過去需要動用真人演員、佈景、攝影團隊的短劇或漫劇製作,現在可透過文字或圖片直接生成 16 秒的連貫片段,且聲畫同步、語言可選。尤其對於需要大量產出內容的短劇平台來說,這套工具能有效降低人力與時間成本。但同時也引發擔憂:若生成品質接近真人實拍,版權歸屬與行業勞動結構可能產生新的衝擊。

**技術亮點:16 秒聲畫同步與多語言渲染**

Vidu Q3 支援 16 秒的連貫片段,比多數同類模型(常見 4~8 秒)顯著更長,且能一次生成搭配影像的配音或背景音。此外,多國語言文字渲染讓創作者可直接在影片中嵌入字幕或標題文字,無需後期額外作業。這對於需要國際化發行的內容(如短劇出海)尤其實用,可能成為華為雲生態中的差異化競爭優勢。

**華為雲的角色:基礎設施與生態整合**

Vidu Q3 選擇上線華為雲,而非獨立 App 或網站,透露出生數科技對算力與商業化路徑的思考。華為雲的 AI 算力叢集、儲存與內容分發網路,能讓模型以 API 形式提供給開發者與影視團隊,降低部署門檻。後續華為雲可能將 Vidu Q3 整合進自家媒體處理服務(如 Video Editing Suite),或與鴻蒙生態中的影音應用串接,形成從生成到播放的一條龍服務。

**讀者可關注的後續發展**

接下來值得觀察的重點包括:

- Vidu Q3 在實際創作場景中的表現,例如能否穩定維持角色、場景的一致性,以及多鏡頭敘事是否真的流暢自然。

- 與競爭模型(如騰訊混元、字節跳動 Boximator 等)的比較,特別是在臺灣市場能取得的版本與支援語系。

- 華為雲是否會針對短劇、漫劇領域推出專屬定價方案或模板,讓小型創作者負擔得起。

- 版權與倫理議題:AI 生成內容的著作權歸屬、訓練資料來源等,後續法規動向也將影響實務應用。

**總結:AI 影片創作進入「故事化」時代**

Vidu Q3 的「為劇而生」不只是行銷口號,而是真正試圖將 AI 從「片段生產工具」提升為「敘事協作夥伴」。當 16 秒、1080P、多鏡頭、聲畫同步都能一鍵生成,創作者的重心將從繁瑣的技術細節轉回腳本與創意本身。對於臺灣的內容創作者來說,這類工具若能穩定上線並支援繁體中文與在地用語,無論是製作 YouTube 短劇、教學動畫或商業廣告,都將迎來一波新的效率革命。

Related

相關文章

智東西生成式AI

庫克攤牌了:漲價!

智東西 編譯 | 陳佳 編輯 | 雲鵬 智東西6月22日消息,據《華爾街日報》昨日報道,AI行業對存儲芯片的海量需求正引發一場波及全球的消費電子漲價潮。蘋果、微軟、任天堂、索尼等廠商近期密集上調產品售價,蘋果公司CEO蒂姆·庫克(Tim Cook)坦言公司已無力獨自消化上游成本上漲壓力,計劃在未來數月上調產品售價。 這場漲價的根源直指AI產業擴張。DRAM和NAND閃存既是手機、筆記本、遊戲主機等消費設備的基礎硬件,也是AI企業訓練和運行大模型的關鍵資源。AI行業的爆發式增長大量吞噬了同類芯片產能,導致全球存儲芯片供應陷入嚴重緊缺。 芯片廠商從中大幅獲益,全球三家存儲芯片巨頭——SK海力士、三星電子和美光科技,成為最大贏家。過去半年SK海力士與美光市值均飆漲約四倍,各自突破1萬億美元(約合人民幣6.77萬億元)。 而成本壓力層層向消費者端傳導,過去一年美光一款主流數據中心內存芯片合約價漲幅接近4倍。 據Investing 2026年6月20日報道,高盛下調了2026年和2027年全球智能手機出貨量預測,理由是存儲芯片價格持續上漲抑制市場需求。 在新設備售價持續走高的背景下,二手翻新設備市場正迎來新一輪增長窗口,多家翻新交易平臺在品質管控和售後保障方面持續加碼。 與此同時,分析師預測新建晶圓廠需要兩到三年才能投產,芯片短缺和漲價態勢還將持續數年,消費電子買家短期內難以等到降價拐點。 一、各品類消費電子密集漲價,成本壓力轉嫁給消費者 消費者已在各類產品上切身感受到漲價衝擊。微軟上週公佈新款Surface Pro筆記本起售價為1599美元(約合人民幣1.08萬元),較上一代產品上漲600美元(約合人民幣4062元)。 任天堂5月將Switch 2遊戲主機售價上調50美元(約合人民幣339元)至499美元(約合人民幣3378元),官方就此致歉稱“為本次調價給消費者帶來的影響致以誠摯

4 小時前
智東西生成式AI

剛剛,阿里HappyHorse1.1上線,我用它把國足送進世界盃

智東西 作者 | 陳駿達 編輯 | 心緣 智東西6月22日報道,今天,阿里巴巴發佈了其最新一代視頻生成模型HappyHorse 1.1(快樂小馬1.1)。阿里稱,相比HappyHorse 1.1,這代模型在動態表現力、主體一致性、指令遵循、視覺質感和音頻能力等維度有了一定提升。 HappyHorse 1.1的技術規格與HappyHorse 1.0保持一致,單次生成時長為3至15秒,支持720p和1080p分辨率和自由寬高比。 阿里官方曬出了幾個HappyHorse 1.1的生成結果。在舞蹈這類考驗模型動態表現力和動作連貫性的任務上,HappyHorse 1.1生成的動作流暢自然,沒有像過去許多視頻生成模型一樣出現慢動作、殘影等問題,人體特徵符合正常情況,長相也保持了一致。 在風格化內容方面,HappyHorse 1.1在下方案例中很好地保持了傳統中國畫的畫風,沒有出現風格偏移等問題。 模型發佈後,智東西第一時間對HappyHorse 1.1進行了實測,並將其表現與HappyHorse 1.0和近期發佈的Seedance 2.0 Mini進行了對比。從實測結果看來,HappyHorse 1.1較上一代模型的確實現了一定提升,尤其是畫面“油膩感”問題得到了較好的解決。不過,在部分邊緣場景、多參考主體的任務上,其生成結果的真實感、物理規律遵循還有優化空間。 目前,HappyHorse 1.1已經上線阿里雲百鍊平臺和HappyHorse官網。以文生視頻為例,其生成720p清晰度畫面的價格為每秒0.9元(優惠後0.54元),與HappyHorse 1.0保持一致;生成1080p清晰度畫面的價格為每秒1.2元(優惠後為0.72元),與HappyHorse 1.0相比下調了25%。 體驗鏈接:www.happyhorse.cn API接入:bailian.console.aliyun.c

6 小時前
雷峰網生成式AI

Fable 5 剛被封殺,OpenRouter 用「多模型協作」搞出了「平替天團」

最強 AI 突遭封殺下架,多模型協作能否填補空白? 作者丨高允毅 編輯丨馬曉寧 當世界上最聰明的 AI 被強制拔掉網線,我們能否有另一套方案,用上同樣聰明的智力?2026年6月14日,全球最大的大模型 API 聚合平臺OpenRouter,在 X 上發佈一條推文,短短幾天,吸引近600萬人圍觀。該平臺宣佈推出了世界上最聰明的“複合模型”Fusion API ,能用模型組合的方式,復刻 Claude Fable 5 的智力水平。 所謂“複合模型”,不是靠一個 AI 自己埋頭苦幹,而是讓好多 AI 模型一塊兒配合,做出一份最好的答案,再交給用戶,對外統一用一個API 入口。Fusion API 的橫空出世,踩中了一個微妙的時機。 就在同一周,Anthropic 剛發佈了 史上最強模型Claude Fable 5。該模型以強悍的長週期智能體推理出圈,能將企業原本需要數月的代碼遷移工作縮短至一天。然而,發佈僅 3 天,美國政府便籤發了緊急出口管制令。Anthropic 官方被迫切斷全球網絡,暫停該模型的 API 訪問,原本躍躍欲試的開發者們,瞬間哀嚎遍野。OpenRouter這條推文,正是精準地踩在了市場真空期的最痛點,同時給出一套新方案:與其押注單一模型,不如讓一群模型"開會"。它公佈了一組驚人數據:在深度研究中,由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 組成的“模型專家團”,融合後不僅輕鬆擊敗了 Opus 4.8,其綜合智力與被禁的 Fable 5 相比,得分誤差不到 1%。(注:Claude Fable 5 因內容過濾僅完成 DRACO 100 道任務中的 93 道,中端模型組合完整跑完全部 100 題,二者評測樣本存在差異。)而實現這一切的調用成本,僅僅是 Fable 5 的一半。01Fusion API背後的“多模型拼盤”O

6 小時前