AI日報:千問全面開放第三方Agent與Skill;字節開源統一框架 Bernini;OpenAI 推出 Sites 功能
重點摘要
歡迎來到【AI日報】欄目!這裡是你每天探索人工智能世界的指南,每天我們為你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。新鮮AI產品點擊瞭解:https://app.aibase.com/zh1、阿里千問全面開放第三方Agent與Skill,瑞幸、東航等首批接入測試阿里千問全面開放第三方Agent與Skill,標誌著其戰略升級為‘超級Agent’個人助手。亞馬遜Ring門鈴人臉識別功能遭集體訴訟亞馬遜旗下的Ring門鈴因人臉識別功能引發集體訴訟,指控其在未經同意的情況下收集路人面部信息,侵犯了隱私權。
### AI 日報:千問全面開放第三方 Agent 與 Skill;字節開源統一框架 Bernini;OpenAI 推出 Sites 功能
今日 AI 領域迎來多項重磅動態,涵蓋大型語言模型的生態擴展、開源框架的統一化以及隱私爭議的最新發展。阿里千問正式啟動第三方 Agent 與 Skill 全面開放策略,字節跳動釋出統一多模態框架 Bernini,OpenAI 則推出全新 Sites 功能,拓展應用場景。同時,亞馬遜 Ring 門鈴因人臉識別功能面臨集體訴訟,凸顯 AI 落地過程中的隱私挑戰。以下為重點整理與深度解析。
---
### 阿里千問:從模型走向「超級 Agent」個人助手
阿里千問近期宣布全面開放第三方 Agent 與 Skill,標誌著其從單純的語言模型,正式升級為具備生態整合能力的「超級 Agent」個人助手。所謂 Agent,指的是能自主執行任務的 AI 單元;而 Skill 則類似於外掛功能,讓開發者或企業能為千問添加特定領域的專屬能力。透過開放 API,第三方公司可以將自己的服務直接嵌入千問的對話與任務流程中,例如訂餐、查航班、控制智慧家居等,使千問不再只是「問答機器人」,而是能實際代辦事務的數位助理。首批接入測試的合作夥伴包括瑞幸咖啡、東方航空等知名品牌,顯示出阿里有意從消費級應用切入,快速累積實戰場景。
---
### 背景脈絡:為何阿里此時大舉開放?
回顧過去一年,各大 AI 廠商紛紛從「模型競賽」轉向「生態競賽」。百度的文心一言、騰訊的混元等均嘗試建立插件市場,但千問此次的開放策略更為徹底——不僅開放第三方開發者上架 Skill,還允許企業自定義 Agent 並整合內部系統。這背後反映了阿里雲的戰略思維:與其死守自家產品,不如將千問打造成底層的 AI 基礎設施,讓各行各業都能在上面快速建構專屬智慧助手。尤其對於零售、交通、餐飲等行業,若能透過千問直接串接 CRM、庫存管理或客服系統,將大幅降低 AI 落地門檻。
---
### 字節跳動開源 Bernini:統一多模態框架的目的
字節跳動近日開源了名為 Bernini 的統一框架,據了解這是一套專為多模態 AI 設計的基礎架構,能夠同時處理文字、圖像、音訊甚至影片等多種資料形式。過去,不同模態的模型往往各自獨立開發,導致維護成本高、跨模態協作困難。Bernini 的出現旨在提供一個標準化的底層介面,讓開發者能以相同邏輯訓練和部署多模態模型,並簡化從研究到產品的轉換流程。值得注意的是,字節跳動選擇開源此框架,很可能是在複製其過往在推薦系統、短影音領域的「開源搶佔社群」策略——透過開放核心技術吸引開發者貢獻,進而影響產業標準。
---
### OpenAI 推出 Sites 功能:從對話走向網站生成
OpenAI 近期低調推出名為「Sites」的新功能,疑似允許使用者直接透過自然語言描述,快速生成靜態網站或品牌頁面。與傳統的 AI 寫文案、生成圖片不同,Sites 更著重於輸出可直接運行的 HTML/CSS 程式碼,結合 OpenAI 既有的 DALL·E 繪圖與 GPT 文字能力,實現「一句話建站」的體驗。雖然目前尚未大規模上線,但業界分析此舉將直接衝擊 Wix、WordPress 等低程式碼建站平台,尤其對於個人創業者或小型商家而言,AI 生成網站的成本幾乎為零。讀者可關注後續是否會整合至 ChatGPT Plus 或 Enterprise 方案,成為新的訂閱增值點。
---
### 亞馬遜 Ring 訴訟:臉部辨識的隱私紅線
在 AI 應用蓬勃發展的同時,隱私爭議也持續升溫。亞馬遜旗下智慧門鈴品牌 Ring 近日因內建人臉識別功能,在美國遭到集體訴訟。指控指出,Ring 在未經路人明確同意的情況下,自動收集並比對其面部資料,涉嫌違反多州生物辨識隱私法。事實上,Ring 過去就曾因與警方共享門鈴畫面而引發爭議,此次訴訟再次敲響警鐘:當 AI 感知能力深入公共與半公共空間時,企業必須在便利性與個人權利之間取得平衡。對於台灣讀者而言,這也提醒我們在選用智慧家居設備時,應留意廠商的資料處理政策。
---
### 讀者可關注的後續發展
綜合今日動態,有幾個面向值得持續追蹤:第一,千問的第三方 Agent 與 Skill 商店何時正式上線?以及收費模式是否會比照 App Store 抽成?第二,字節跳動的 Bernini 開源後,社群貢獻與應用案例是否能在三個月內激增?第三,OpenAI 的 Sites 功能若正式推出,是否會掀起「AI 建站」的新一波創業潮?最後,亞馬遜 Ring 訴訟的判決結果,可能成為美國隱私保護的重要判例,進而影響其他 AI 人臉辨識產品的合規設計。AI 的進展從來不只是技術問題,更是生態、商業與社會責任的綜合命題。
Related
相關文章

Token成本算盤打響,Seedance開始駛向“五環外”
這篇消息聚焦「Token成本算盤打響,Seedance開始駛向“五環外”」。原始導語提到:視頻AI的決勝場,不在模型本身。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

Pixel 10 手機用戶反饋谷歌 AI“搶鏡”問題,Gmail 無法正常回復郵件
科技媒體 Android Authority 昨日(6 月 18 日)發佈博文,報道稱 Pixel 10 系列手機遭遇 AI“搶鏡”問題,用戶在 Gmail 回覆郵件時無法彈出輸入法鍵盤,優先顯示 Help me write 功能。

DeepSeek 識圖模式正式上線 App 和網頁端
DeepSeek 多模態研究員 Xiaokang Chen 今日表示,DeepSeek 的識圖模式已在網頁和 App 端正式上線。IT之家測試,目前 DeepSeek 的 App 端識圖模式依然提示“圖片理解功能內測中”,網頁端沒有這項提示。

微信、豆包之後,消息稱阿里將推“千問輸入法”
千問團隊將推出名為“千問輸入法”的獨立 App,與 PC 端的千問語音輸入法有一定區別,AI 功能、鍵盤會更貼合手機端操作,填補千問在移動端 AI 輸入法賽道的空白,產品已開發完成,擇日上線各大應用商店。
Kimi Work 迎重大升級:推出“目標模式”並打通外部應用插件
月之暗面旗下 Kimi 電腦客戶端近日煥新升級,為 Kimi Work(Beta 版)引入兩項重磅新特性:目標模式實現連續自主工作 24 小時,插件中心正式對接多家主流辦公軟件,提升工作流效率。為加速用戶深度體驗,官方同步推出限時優惠,2026 年 6 月全月,使用 Work 模式的會員額度消耗直接打 5 折,帶來實惠。
網易雲音樂旗下AI情感陪伴App“妙時”宣佈7月14日停運
網易雲音樂旗下“妙時”(含AI奇遇)AI情感陪伴應用發佈停運公告,將於7月14日0時全面停止服務。客服迴應屬正常業務調整,不影響其他產品。目前已停止新用戶註冊和充值,用戶可在8月14日前申請退還剩餘代幣和會員費,並導出AI戀人聊天記錄。