為劇而生：生數 Vidu Q3 多模態大模型上線華為雲，主打文 / 圖生視頻一體化成片能力

2026年6月22日 21:26

重點摘要

據介紹，Vidu Q3 是全球首個「為劇而生」的視頻大模型，支持 16 秒聲畫同出、1080P 畫質，擁有穩定多鏡頭敘事與精準切鏡能力，並具備多國語言文字渲染及多語言輸出功能，可用於漫劇、短劇、影視劇等專業內容創作。

站內 AI 整理稿

**重點整理**

生數科技旗下多模態大模型 Vidu Q3 正式上線華為雲，主打「文生影片」與「圖生影片」一體化生成能力，並標榜為全球首個以「為劇而生」為定位的影片模型。該模型支援 16 秒長度、1080P 解析度，且能同步產出聲音與畫面；同時具備穩定多鏡頭敘事與精準切鏡技術，並內建多國語言文字渲染及多語言輸出功能，適用於漫劇、短劇、影視劇等專業內容創作場景。

**背景脈絡：從生成到敘事，影片 AI 的關鍵躍進**

過去一年，市面上多數影片生成模型（如 Runway、Pika 等）仍停留在「單鏡頭、短片段」階段，難以滿足連貫故事敘述的需求。Vidu Q3 的「多鏡頭敘事」與「切鏡精準度」正是為了解決這個痛點而設計，讓創作者不必靠後製手動拼接，就能產出具備基本導演技法的影片。此舉也反映出 AI 影片工具正從「生成素材」進化到「生成故事」，而華為雲作為底層算力平台，則為這類高強度運算需求提供穩定支撐。

**可能影響：降低專業創作門檻，加速短劇與漫劇量產**

對獨立創作者、小型工作室而言，Vidu Q3 的出現可能大幅縮短從腳本到成片的時間。過去需要動用真人演員、佈景、攝影團隊的短劇或漫劇製作，現在可透過文字或圖片直接生成 16 秒的連貫片段，且聲畫同步、語言可選。尤其對於需要大量產出內容的短劇平台來說，這套工具能有效降低人力與時間成本。但同時也引發擔憂：若生成品質接近真人實拍，版權歸屬與行業勞動結構可能產生新的衝擊。

**技術亮點：16 秒聲畫同步與多語言渲染**

Vidu Q3 支援 16 秒的連貫片段，比多數同類模型（常見 4～8 秒）顯著更長，且能一次生成搭配影像的配音或背景音。此外，多國語言文字渲染讓創作者可直接在影片中嵌入字幕或標題文字，無需後期額外作業。這對於需要國際化發行的內容（如短劇出海）尤其實用，可能成為華為雲生態中的差異化競爭優勢。

**華為雲的角色：基礎設施與生態整合**

Vidu Q3 選擇上線華為雲，而非獨立 App 或網站，透露出生數科技對算力與商業化路徑的思考。華為雲的 AI 算力叢集、儲存與內容分發網路，能讓模型以 API 形式提供給開發者與影視團隊，降低部署門檻。後續華為雲可能將 Vidu Q3 整合進自家媒體處理服務（如 Video Editing Suite），或與鴻蒙生態中的影音應用串接，形成從生成到播放的一條龍服務。

**讀者可關注的後續發展**

接下來值得觀察的重點包括：

- Vidu Q3 在實際創作場景中的表現，例如能否穩定維持角色、場景的一致性，以及多鏡頭敘事是否真的流暢自然。

- 與競爭模型（如騰訊混元、字節跳動 Boximator 等）的比較，特別是在臺灣市場能取得的版本與支援語系。

- 華為雲是否會針對短劇、漫劇領域推出專屬定價方案或模板，讓小型創作者負擔得起。

- 版權與倫理議題：AI 生成內容的著作權歸屬、訓練資料來源等，後續法規動向也將影響實務應用。

**總結：AI 影片創作進入「故事化」時代**

Vidu Q3 的「為劇而生」不只是行銷口號，而是真正試圖將 AI 從「片段生產工具」提升為「敘事協作夥伴」。當 16 秒、1080P、多鏡頭、聲畫同步都能一鍵生成，創作者的重心將從繁瑣的技術細節轉回腳本與創意本身。對於臺灣的內容創作者來說，這類工具若能穩定上線並支援繁體中文與在地用語，無論是製作 YouTube 短劇、教學動畫或商業廣告，都將迎來一波新的效率革命。

原始來源：IT之家 ↗

查看原始來源

IT之家生成式AI

Anthropic 工程負責人：Claude Code 讓程序員更孤獨

Anthropic 工程負責人指出，Claude Code 可能讓程序員感到更孤獨。為此，團隊重拾面對面交流，舉辦編程午餐、黑客松和共同開發時段，鼓勵工程師一起工作，並互相學習不同的 AI 工作流程。

剛剛閱讀分析

36氪生成式AI

Claude Code破解3500年前死語言，74年來最大考古語言學突破

這篇消息聚焦「Claude Code破解3500年前死語言，74年來最大考古語言學突破」。原始導語提到：可能是74年來最大考古語言學突破從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

智東西生成式AI

庫克攤牌了：漲價！

智東西編譯 | 陳佳編輯 | 雲鵬智東西6月22日消息，據《華爾街日報》昨日報道，AI行業對存儲芯片的海量需求正引發一場波及全球的消費電子漲價潮。蘋果、微軟、任天堂、索尼等廠商近期密集上調產品售價，蘋果公司CEO蒂姆·庫克（Tim Cook）坦言公司已無力獨自消化上游成本上漲壓力，計劃在未來數月上調產品售價。這場漲價的根源直指AI產業擴張。DRAM和NAND閃存既是手機、筆記本、遊戲主機等消費設備的基礎硬件，也是AI企業訓練和運行大模型的關鍵資源。AI行業的爆發式增長大量吞噬了同類芯片產能，導致全球存儲芯片供應陷入嚴重緊缺。芯片廠商從中大幅獲益，全球三家存儲芯片巨頭——SK海力士、三星電子和美光科技，成為最大贏家。過去半年SK海力士與美光市值均飆漲約四倍，各自突破1萬億美元（約合人民幣6.77萬億元）。而成本壓力層層向消費者端傳導，過去一年美光一款主流數據中心內存芯片合約價漲幅接近4倍。據Investing 2026年6月20日報道，高盛下調了2026年和2027年全球智能手機出貨量預測，理由是存儲芯片價格持續上漲抑制市場需求。在新設備售價持續走高的背景下，二手翻新設備市場正迎來新一輪增長窗口，多家翻新交易平臺在品質管控和售後保障方面持續加碼。與此同時，分析師預測新建晶圓廠需要兩到三年才能投產，芯片短缺和漲價態勢還將持續數年，消費電子買家短期內難以等到降價拐點。一、各品類消費電子密集漲價，成本壓力轉嫁給消費者消費者已在各類產品上切身感受到漲價衝擊。微軟上週公佈新款Surface Pro筆記本起售價為1599美元（約合人民幣1.08萬元），較上一代產品上漲600美元（約合人民幣4062元）。任天堂5月將Switch 2遊戲主機售價上調50美元（約合人民幣339元）至499美元（約合人民幣3378元），官方就此致歉稱“為本次調價給消費者帶來的影響致以誠摯

4 小時前閱讀分析

36氪生成式AI

Claude下一代神級模型秘密出爐，Sonnet-5被曝下週上線

這篇消息聚焦「Claude下一代神級模型秘密出爐，Sonnet-5被曝下週上線」。原始導語提到：封禁，反而讓Anthropic更快了？從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

5 小時前閱讀分析

智東西生成式AI

剛剛，阿里HappyHorse1.1上線，我用它把國足送進世界盃

智東西作者 | 陳駿達編輯 | 心緣智東西6月22日報道，今天，阿里巴巴發佈了其最新一代視頻生成模型HappyHorse 1.1（快樂小馬1.1）。阿里稱，相比HappyHorse 1.1，這代模型在動態表現力、主體一致性、指令遵循、視覺質感和音頻能力等維度有了一定提升。 HappyHorse 1.1的技術規格與HappyHorse 1.0保持一致，單次生成時長為3至15秒，支持720p和1080p分辨率和自由寬高比。阿里官方曬出了幾個HappyHorse 1.1的生成結果。在舞蹈這類考驗模型動態表現力和動作連貫性的任務上，HappyHorse 1.1生成的動作流暢自然，沒有像過去許多視頻生成模型一樣出現慢動作、殘影等問題，人體特徵符合正常情況，長相也保持了一致。在風格化內容方面，HappyHorse 1.1在下方案例中很好地保持了傳統中國畫的畫風，沒有出現風格偏移等問題。模型發佈後，智東西第一時間對HappyHorse 1.1進行了實測，並將其表現與HappyHorse 1.0和近期發佈的Seedance 2.0 Mini進行了對比。從實測結果看來，HappyHorse 1.1較上一代模型的確實現了一定提升，尤其是畫面“油膩感”問題得到了較好的解決。不過，在部分邊緣場景、多參考主體的任務上，其生成結果的真實感、物理規律遵循還有優化空間。目前，HappyHorse 1.1已經上線阿里雲百鍊平臺和HappyHorse官網。以文生視頻為例，其生成720p清晰度畫面的價格為每秒0.9元（優惠後0.54元），與HappyHorse 1.0保持一致；生成1080p清晰度畫面的價格為每秒1.2元（優惠後為0.72元），與HappyHorse 1.0相比下調了25%。體驗鏈接：www.happyhorse.cn API接入：bailian.console.aliyun.c

6 小時前閱讀分析

雷峰網生成式AI

Fable 5 剛被封殺，OpenRouter 用「多模型協作」搞出了「平替天團」

最強 AI 突遭封殺下架，多模型協作能否填補空白？作者丨高允毅編輯丨馬曉寧當世界上最聰明的 AI 被強制拔掉網線，我們能否有另一套方案，用上同樣聰明的智力？2026年6月14日，全球最大的大模型 API 聚合平臺OpenRouter，在 X 上發佈一條推文，短短幾天，吸引近600萬人圍觀。該平臺宣佈推出了世界上最聰明的“複合模型”Fusion API ，能用模型組合的方式，復刻 Claude Fable 5 的智力水平。所謂“複合模型”，不是靠一個 AI 自己埋頭苦幹，而是讓好多 AI 模型一塊兒配合，做出一份最好的答案，再交給用戶，對外統一用一個API 入口。Fusion API 的橫空出世，踩中了一個微妙的時機。就在同一周，Anthropic 剛發佈了史上最強模型Claude Fable 5。該模型以強悍的長週期智能體推理出圈，能將企業原本需要數月的代碼遷移工作縮短至一天。然而，發佈僅 3 天，美國政府便籤發了緊急出口管制令。Anthropic 官方被迫切斷全球網絡，暫停該模型的 API 訪問，原本躍躍欲試的開發者們，瞬間哀嚎遍野。OpenRouter這條推文，正是精準地踩在了市場真空期的最痛點，同時給出一套新方案：與其押注單一模型，不如讓一群模型"開會"。它公佈了一組驚人數據：在深度研究中，由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 組成的“模型專家團”，融合後不僅輕鬆擊敗了 Opus 4.8，其綜合智力與被禁的 Fable 5 相比，得分誤差不到 1%。（注：Claude Fable 5 因內容過濾僅完成 DRACO 100 道任務中的 93 道，中端模型組合完整跑完全部 100 題，二者評測樣本存在差異。）而實現這一切的調用成本，僅僅是 Fable 5 的一半。01Fusion API背後的“多模型拼盤”O