智東西AI Agent

今天,美圖造了一支AI影像團隊!

2026年6月17日 15:55

重點摘要

作者 | 陳佳 編輯 | 漠影 智東西6月17日報道,今日,美圖公司創始人、董事長兼CEO吳欣鴻在2026美圖影像節上,親自整了一齣AI短劇。他用自家新品RoboNeo演了一部古風穿越劇,選題、角色、分鏡、配樂全由AI Agent拆解執行。這也是美圖想強調的變化:AI不只是生成一張圖或一段視頻,而是參與到完整創作流程裡。 今天下午,美圖一口氣發佈了八款產品,分別是MeituHub、RoboNeo、開拍、MVLAND、Artflo、美圖設計室、Picchi和站酷,覆蓋影像生產線搭建、AI短劇、口播視頻、MV製作、概念影像、商業設計、人像修圖和設計師社區。 貫穿這八款產品的底層邏輯是“Agent Teams”,即多個AI Agent各司其職、自動分工協作,不再只是完成單個任務,而是直接交付成果。 吳欣鴻談到,很多場景已經形成高度共識,真正考驗產品能力的是如何發現非共識場景,如何深度洞察音樂人、設計師、商家、短劇創作者等具體人群的需求。如果沒有這些洞察,產品很難做好。 圍繞新產品機制,吳欣鴻提到AI原生應用需要一套漏斗機制,本質上還是看PMF,也就是產品與市場的匹配,核心要回到新的場景和真實痛點。 一、MeituHub將AI能力封裝成生產線,用大白話提需求就能跑起來 八款產品中,壓軸登場的MeituHub被定位為AI影像生產線,面向個人用戶、開發者和企業三類客戶。其核心亮點是用戶用自然語言說清需求,AI Agent自動組織所需模型與API,搭建出一條可複用的影像生產線。 現場演示了一個場景:一位商場運營人員在MeituHub對話框中輸入“幫我做一個能批量生成活動物料的工具”,系統幾秒內識別出上傳的活動文件夾,分析出這是一個覆蓋20家門店的寵物節宣傳需求,隨即開始自動組裝提示詞引擎、圖像檢測、LayerFlow、效果配方等組件,拼出一條完整生產線。 搭建完成後用戶有兩種選擇:生成一

站內 AI 整理稿

作者 | 陳佳 編輯 | 漠影 智東西6月17日報道,今日,美圖公司創始人、董事長兼CEO吳欣鴻在2026美圖影像節上,親自整了一齣AI短劇。他用自家新品RoboNeo演了一部古風穿越劇,選題、角色、分鏡、配樂全由AI Agent拆解執行。這也是美圖想強調的變化:AI不只是生成一張圖或一段視頻,而是參與到完整創作流程裡。 今天下午,美圖一口氣發佈了八款產品,分別是MeituHub、RoboNeo、開拍、MVLAND、Artflo、美圖設計室、Picchi和站酷,覆蓋影像生產線搭建、AI短劇、口播視頻、MV製作、概念影像、商業設計、人像修圖和設計師社區。 貫穿這八款產品的底層邏輯是“Agent Teams”,即多個AI Agent各司其職、自動分工協作,不再只是完成單個任務,而是直接交付成果。 吳欣鴻談到,很多場景已經形成高度共識,真正考驗產品能力的是如何發現非共識場景,如何深度洞察音樂人、設計師、商家、短劇創作者等具體人群的需求。如果沒有這些洞察,產品很難做好。 圍繞新產品機制,吳欣鴻提到AI原生應用需要一套漏斗機制,本質上還是看PMF,也就是產品與市場的匹配,核心要回到新的場景和真實痛點。 一、MeituHub將AI能力封裝成生產線,用大白話提需求就能跑起來 八款產品中,壓軸登場的MeituHub被定位為AI影像生產線,面向個人用戶、開發者和企業三類客戶。其核心亮點是用戶用自然語言說清需求,AI Agent自動組織所需模型與API,搭建出一條可複用的影像生產線。 現場演示了一個場景:一位商場運營人員在MeituHub對話框中輸入“幫我做一個能批量生成活動物料的工具”,系統幾秒內識別出上傳的活動文件夾,分析出這是一個覆蓋20家門店的寵物節宣傳需求,隨即開始自動組裝提示詞引擎、圖像檢測、LayerFlow、效果配方等組件,拼出一條完整生產線。 搭建完成後用戶有兩種選擇:生成一個網頁應用來上傳素材、批量產出物料,或者通過CLI/API將這條生產線嵌入原有業務流程,替換某個節點、新增某個節點、對整條流程做增強。換句話說,這不是一個“幫你出圖”的工具,而是一個“幫你造工具”的工具。 MeituHub還提供專家定製服務,由美圖工程團隊全流程陪跑,面向教育、遊戲、營銷等垂直場景定製專屬AI影像生產線。現場展示的案例包括用AI Agent為課件生成專業配圖、生成遊戲角色視覺素材,以及批量產出商場活動海報。該產品將於8月5日上線。 二、RoboNeo主打日更級AI短劇團隊,支持更新劇情和實時數據返哺續集 用戶用RoboNeo做一部男主穿越爽劇——《穿越吧,陸離》,RoboNeo自動從角色資產庫裡調出霸總陸離、老股東鄭百川、秘書林晚和保鏢石磊四個角色。 RoboNeo還生成了一句話摘要、詳細劇情描述和完整四分鏡腳本。每個鏡頭都有具體的鏡頭語言標註。 用戶還可以更新劇情,讓男主穿越成古風修仙人士。 或者讓男主成為美劇《權力的遊戲》裡面的屠龍少年。 根據美圖公佈的數據,RoboNeo上線以來在巴西連續7天登頂應用榜首,在27個國家和地區登頂分類榜,2026年上半年單月創作量增長了20倍。 該產品為用戶組建了六大AI Agent:策劃Agent負責數據挖掘和追熱點,編劇Agent負責寫劇情和設計反轉,導演Agent負責拆分鏡和控制鏡頭語言,美術Agent負責定角色和視覺風格,執行Agent負責調模型和生成鏡頭,運營Agent負責發佈測試和評論分析。 六大Agent底層由熱點分析、故事結構、分鏡鏡頭、美術風格、模型編排和平臺規則六類行業Skill支撐。 值得關注的是RoboNeo的數據迴流機制。系統能回收完播率、留存、互動、評論和轉化數據,識別觀眾偏好與流失節點,再將分析結果反哺為下一集的選題和劇情優化建議。 RoboNeo支持角色、世界觀和風格的存檔與跨劇複用,多人可在線協作,並計劃整合站酷設計師資產和IP授權資產構建AI短劇生態。 三、口播視頻老將再升級,組建了一支AI口播視頻團隊,還能搞抽象 開拍發佈於2023年美圖影像節,深耕口播視頻賽道已滿三年。美圖稱,其月活躍創作者超300萬,累計內容創作數達4.46億。 此次核心升級是“開拍AI助手”。開拍為每位用戶組建了一支AI口播視頻團隊:導演Agent統籌全局,營銷Agent下設熱點營銷員、內容策劃師、賬號運營、增長投放師和數據分析師五個細分角色,拍攝Agent下設美術指導、素材生成師和攝像師,剪輯Agent下設審片初剪師、剪輯師、混音師和封面設計師,另有資產管理Agent統一管理素材、品牌和IP資產。 用戶輸入視頻創作需求、起號目標和社媒賬號信息後,這支團隊會主動追熱點、出提案、自動完成網感包裝和素材混剪,並通過追蹤賬號表現持續迭代內容。 美圖還在現場用開拍“搞抽象”,做了一部宮鬥劇。 四、美圖設計室轉向交付式AI,可一鍵生成商業物料 美圖設計室發佈於2022年美圖影像節,月付費用戶規模超過160萬,每月AI生成的圖片和視頻數量超過1.3億。 美圖設計室這次的重點是“交付式AI”。現場用跨境電商場景演示,從鞋類產品文案,到產品賣點圖、詳情頁、社媒物料,再到一套營銷方案和物料,強調用戶真正要的不是生成一張圖,而是完成商業設計閉環。 它的Agent Teams包括市場洞察Agent、內容策劃Agent、視覺創作Agent和數據分析Agent,並配有70+ Skills,可交付全套電商物料、品牌VI設計、圖文筆記、帶貨視頻、宣傳海報和商業PPT。 五、MVLAND讓AI讀懂音樂情緒批量造MV,Artflo把靈感碎片變成概念影像 MVLAND是今天發佈會上一款差異化很明顯的新品,其定位為“為音樂拍大片”。 美圖稱,視頻平臺已佔據全球音樂播放總時長的三分之一,超過80%的年輕人通過短視頻第一次發現一首新歌。但傳統MV製作成本從幾萬到幾十萬人民幣不等、耗時兩三個月,通用AI視頻工具又“讀不懂音樂”,製作流程碎片化且畫面與音樂情緒不匹配。 MVLAND的產品邏輯是,讓每一首歌都有自己的MV。 MVLAND圍繞五個核心要素搭建了專屬MV場景的能力:音樂理解、人物演繹、視覺風格、情緒編排和歌詞字幕。 該產品配備了音樂分析Agent和創意畫布剪輯臺,支持多軌道分層剪輯畫面、字幕與音頻,並提供資產歷史功能記錄全局創作軌跡。 這款產品對應的正是吳欣鴻說的“非共識機會”——深度洞察音樂人的需求,做大模型覆蓋不到的垂直場景。 Artflo定位為“由靈感碎片至概念影像”的創作工具,瞄準遊戲概念美術、產品概念視頻、品牌概念片、AI數字藝術和線下影像裝置等場景。 Artflo的產品鏈路從“靈感助手”開始,把圖片、視頻、3D、文字等輸入理解為多維關鍵信息,再提煉情緒和視覺共性,形成方向卡,最終確定概念影像調性和創作框架。 隨後,Artflo工作臺把框架落地為概念影像,覆蓋美學、運鏡、分鏡、配樂和特效;資產庫則把作品沉澱成美術基調、表達風格、主體設計和實時特效。 六、Picchi專做人像氛圍感修圖,能學習用戶和博主的精修手法 Picchi發佈環節的開場有點意思。去抖音和小紅書搜“AI修圖”,緊跟出現的聯想詞是“人工智障”。 這就是Picchi要解決的問題。Picchi定位為“氛圍感修圖師”,主打三個核心能力:用戶導入過往手動精修的照片後AI能學習修圖手法(學我修圖),批量自動精修上千張照片(批量精修),以及套用顏值博主的修圖配方一鍵出片(學TA修圖)。 發佈會現場展示了Picchi與其他大模型在人像修圖上的效果對比。 美圖稱,Picchi未來80%的能力會集成到美圖秀秀裡,但短期內,Picchi會把美圖秀秀裡的深度用戶剝離出來,專注做更深的人像修圖體驗。其中,“學Ta修圖”會是未來比較大的增長點。 結語:從交付功能到交付成果,美圖把影像產品統一到一支AI團隊裡 這次影像節現場,大屏反覆出現一句話:“你的AI影像團隊已就位。”從已有產品看,美圖並沒有只發布新App,而是把修圖、商業設計、口播、概念影像、MV、短劇、社區資產和生產線工具放進同一套敘事裡。 如果說美圖奇想大模型V6是底座,MeituHub更像是面向企業和開發者的生產線入口,RoboNeo、MVLAND、Artflo負責新的內容形態,美圖設計室、開拍、Picchi則把已有用戶場景繼續做深。站酷的位置更靠近社區和資產,給這些影像產品補充創作者、素材和審美判斷。 美圖做了一個類比:AI工具正在走向“自動駕駛”。從傳統工具到AI Copilot,再到AI Agent和AI全託管,美圖這次試圖說明的,是影像產品的競爭正在從“誰能生成”轉向“誰能交付可用成果”。這也是這場發佈會最清晰的一條線索。

Related

相關文章

MarkTechPost AIAI Agent

Crawlee for Python:打造具備機器人處理、連結圖譜與RAG分塊匯出的網頁爬取管道

在本教學中,我們建置了一套完整的 Crawlee for Python 工作流程,涵蓋環境設定、本機網站生成、靜態爬取、動態爬取、結構化擷取及下游資料處理。首先,我們配置相容的 Crawlee 執行環境,包含固定版本的 Pydantic 支援、Playwright 瀏覽器安裝、持久化儲存目錄,以及 Colab 安全執行處理。接著,我們產生一個擬真的本機示範網站,包含產品頁面、文件頁面、部落格內容、內部連結、robots.txt 規則、JSON-LD 元資料,以及 JavaScript 渲染的商品目錄。透過 BeautifulSoupCrawler,我們執行快速的遞迴 HTML 爬取,並擷取頁面標題、元資料、文字預覽、對外連結、產品屬性、文件標題、程式碼區塊與部落格標籤。

11 小時前
MarkTechPost AIAI Agent

Nous Research Updates Hermes Agent With a Blank Slate Mode That Pins Toolsets via platform_toolsets.cli and disabled_toolsets

Nous Research has added a Blank Slate setup mode to its open-source Hermes Agent. It inverts the usual onboarding. Instead of a fully loaded default, you start with almost nothing. Hermes Agent is the self-improving agent framework from Nous Research. It runs on your own machine. The team announced the new mode on X. Blank Slate now joins two existing options: Quick Setup and Full Setup. TL;DR Blank Slate boots an agent with everything off except provider & model, File Operations, and Terminal. Web, browser, code execution, vision, memory, delegation, cron, skills, plugins, and MCP stay disabled. It writes an explicit platform_toolsets.cli list plus agent.disabled_toolsets to pin the surface. Nothing you skipped loads later — not even after hermes update. Re-enable anything with hermes too

20 小時前
MarkTechPost AIAI Agent

NVIDIA AI 推出 SpatialClaw:無需訓練的代理程式,將程式碼視為空間推理的動作介面

NVIDIA Research 發布了 SpatialClaw,這是一個無需訓練的空間推理框架。該框架針對視覺語言模型(VLM)持續存在的弱點——難以判斷物體的位置、相對關係及在三維空間中的移動方式。SpatialClaw 不重新訓練模型,而是改變代理程式用來呼叫感知工具的動作介面。研究團隊指出,介面才是瓶頸所在。他們的解決方案是將程式碼作為動作介面。在 20 項基準測試中,SpatialClaw 達到平均 59.9% 的準確率,比近期發布的空間代理 SpaceTools 高出 11.2 個百分點。

1 天前
Hugging Face BlogAI Agent

MosaicLeaks: Can your research agent keep a secret?

Back to Articles MosaicLeaks: Can your research agent keep a secret? Enterprise Article Published June 18, 2026 Upvote - Alexander Gurung agurung Follow ServiceNow Rafael Pardinas rafapi-snow Follow ServiceNow TL;DR Deep research agents increasingly combine private local documents with external tools like web retrieval, creating a privacy risk: an agent's external queries may leak sensitive information. MosaicLeaks proposes a new deep-research task with multi-hop questions that interleave public and private information. Across the models we tested, agents frequently leaked private information, and training only for task performance made it worse. We propose a mosaic-leakage-aware RL training method, Privacy-Aware Deep Research (PA-DR), which raises strict chain success (the share of chains

3 天前