雷峰網生成式AI

豆包推出專業版,能成為你的「工作搭子」嗎?

2026年6月26日 04:24

重點摘要

你熟悉的豆包,變了。6月24日,豆包發佈基於最新豆包2.1系列大模型的豆包專業版。過去大家用 AI,常見姿勢是:問問題、寫文案、改稿子、做總結、生成圖片。AI 給一段答案,後面的複製、整理、排版、填表、做 PPT、搭網頁,還是自己來。豆包專業版想往前多走一步,讓 AI 從對話框裡走出來,進入真實複雜工作任務。專業版新增 Agent 驅動的辦公任務模式,它不是簡單把免費版的額度放大,也不只是把模型換成更強版本,而是想真正幫到職場人士。這一模式搭載豆包 2.1 Pro,可以將找資料、寫文檔、做報告等工作任務一網打盡。當然,免費用戶的日常使用不受影響,也可以在一定額度內體驗搭載豆包 2.1 turbo 的辦公任務模式。目前看來,豆包付費訂閱的檔位,也遠低於海外主流大模型,價格還算良心。換句話說,豆包並沒有把原來的免費體驗直接收窄,而是在免費能力之上,劃出一個更偏生產力、更偏高頻重度使用的專業層。專業版到底“專業”在哪裡過去一年,大模型產品的競爭,很大程度上圍繞“誰回答得更好”展開。模型能不能寫出更自然的文案,能不能更準確地總結網頁,能不能更好地理解圖片、寫代碼,是用戶最直觀的評價標準。但專業用戶在真實工作裡遇到的問題,往往不是“問一個問題,得到一段答案”這麼簡單。做一份行業調研,要搜索資料、篩選來源、組織結構、生成文檔,最好還能繼續改;做一個活動頁面,不能只給出代碼片段,還要能創建頁面、修改樣式、部署預覽,甚至連接後端數據庫。豆包專業版主打的辦公任務模式,正是試圖把這些分散步驟串起來。在辦公任務模式下,豆包支持理解工作目標、自主拆解任務,並調用本地電腦/瀏覽器操作、網站生成、Office/飛書集成、Skill 技能、定時任務等能力,幫助用戶完成軟件開發、數據分析、專業設計、流程自動化、金融分析等工作。這意味著產品形態發生了變化。普通對話模式裡,AI 更像一個“答題者”;辦公任務模

站內 AI 整理稿

你熟悉的豆包,變了。6月24日,豆包發佈基於最新豆包2.1系列大模型的豆包專業版。過去大家用 AI,常見姿勢是:問問題、寫文案、改稿子、做總結、生成圖片。AI 給一段答案,後面的複製、整理、排版、填表、做 PPT、搭網頁,還是自己來。豆包專業版想往前多走一步,讓 AI 從對話框裡走出來,進入真實複雜工作任務。專業版新增 Agent 驅動的辦公任務模式,它不是簡單把免費版的額度放大,也不只是把模型換成更強版本,而是想真正幫到職場人士。這一模式搭載豆包 2.1 Pro,可以將找資料、寫文檔、做報告等工作任務一網打盡。當然,免費用戶的日常使用不受影響,也可以在一定額度內體驗搭載豆包 2.1 turbo 的辦公任務模式。目前看來,豆包付費訂閱的檔位,也遠低於海外主流大模型,價格還算良心。換句話說,豆包並沒有把原來的免費體驗直接收窄,而是在免費能力之上,劃出一個更偏生產力、更偏高頻重度使用的專業層。專業版到底“專業”在哪裡過去一年,大模型產品的競爭,很大程度上圍繞“誰回答得更好”展開。模型能不能寫出更自然的文案,能不能更準確地總結網頁,能不能更好地理解圖片、寫代碼,是用戶最直觀的評價標準。但專業用戶在真實工作裡遇到的問題,往往不是“問一個問題,得到一段答案”這麼簡單。做一份行業調研,要搜索資料、篩選來源、組織結構、生成文檔,最好還能繼續改;做一個活動頁面,不能只給出代碼片段,還要能創建頁面、修改樣式、部署預覽,甚至連接後端數據庫。豆包專業版主打的辦公任務模式,正是試圖把這些分散步驟串起來。在辦公任務模式下,豆包支持理解工作目標、自主拆解任務,並調用本地電腦/瀏覽器操作、網站生成、Office/飛書集成、Skill 技能、定時任務等能力,幫助用戶完成軟件開發、數據分析、專業設計、流程自動化、金融分析等工作。這意味著產品形態發生了變化。普通對話模式裡,AI 更像一個“答題者”;辦公任務模式裡,AI 是一個可以調用工具的“執行者”,可以在授權範圍內處理文件、整理信息、操作網頁、生成可交付成果。畢竟,對於真正想拿豆包乾活的人來說,差異不在於它多說了幾句,而在於它能不能把一個跨應用、跨文件、跨步驟的任務真正做完。目前體驗下來,豆包專業版的專業性主要體現在五類能力上。▎第一是本地電腦和瀏覽器操作。用戶明確授權後,豆包可以協助使用電腦裡的應用、瀏覽器和文件,完成資料整理、文件歸類、文檔處理、表格填寫、信息搬運等跨應用操作。這類能力把 AI 從雲端問答拉回到用戶自己的工作環境裡,適合處理文件就在本機、流程分佈在多個軟件裡的任務。▎第二是網站和應用生成。辦公任務模式可以創建、修改、部署網頁應用,並支持帶後端數據庫的信息系統。對非專業開發者來說,這降低了把想法變成可訪問頁面或內部小工具的門檻;對專業開發者來說,它也可以承擔原型搭建、樣式調整、重複代碼生成等環節。▎第三是 Office 與飛書生態集成。辦公任務模式整合飛書辦公套件,可製作在線文檔、表格和 PPT,並支持多輪編輯、在線分享、協同編輯和下載導出。這很關鍵,產出最終往往不是停留在聊天記錄裡,而是要進入文檔、表格、PPT、報告和協作流程。▎第四是 Skill 技能。Skill 是面向特定場景的專項技能包,首批包括文檔、表格、PPT、創意設計、操作瀏覽器、可視化講解,以及金融行業專業技能等,用戶也可以創建和安裝自己的技能。這意味著豆包專業版不只依賴通用模型能力,還在嘗試把可複用的工作方法封裝進產品。▎第五是定時任務。用戶可以讓豆包在指定時間或週期自動執行重複工作,比如整理資料、彙總信息、生成報告或提醒待辦。週報、日報、輿情監測、競品動態,這些都是讓打工人頭疼的週期性任務,現在都可以讓豆包試試了。這些能力組合在一起,就構成了豆包專業版與普通 AI 聊天工具的分界線。為什麼要推出專業版作為一款國民級的AI產品,豆包此前的打法很簡單:通過免費功能、較低使用門檻和多模態能力,讓更多用戶把 AI 當作日常助手。這也是因為,在AI產品的普及階段,大模型產品要先讓足夠多用戶低門檻使用起來,形成習慣。豆包推出專業版,則標誌著 AI 助手產品,正在進入一個新的階段。當用戶量足夠大之後,用戶需求會自然分化。普通用戶可能只是偶爾問問題、寫文案;專業用戶則會把 AI 接進工作流,要求更強模型、更復雜工具調用、更穩定的長任務執行。後者消耗更多算力,也更願意為效率提升付費。專業版實際上就是在回應這種分層:免費版繼續覆蓋大眾日常需求,專業版面向重度複雜工作和生產力場景提供更高額度和更完整工具鏈。從商業邏輯看,專業版也是大模型產品走向可持續的一步。大模型不是一個邊際成本接近於零的傳統互聯網產品。模型訓練、推理、數據中心、芯片、網絡和工程團隊,都需要長期投入。公開報道也能看到字節在 AI 基礎設施上的投入強度。南華早報曾報道,字節已將 2026 年 AI 資本開支計劃上調至逾 2000 億元人民幣,較此前初步討論的 1600 億元方案增長至少 25%;彭博社消息稱,字節曾討論 2026 年最高 700 億美元支出計劃,主要用於數據中心和 AI 基礎設施。這些報道沒有得到官方確認,但它們說明了一個背景:大模型競爭已經從“模型發佈”進入“持續供給”的階段。用戶每天都在使用,任務越來越複雜,模型和工具鏈也要持續升級。只靠免費服務承載所有需求,並不現實。豆包推出專業版並不意味著免費時代結束,但用戶分層已經在所難免。大眾用戶繼續獲得基礎能力和新模型體驗,專業用戶為更高額度、更強模型和更復雜任務執行付費。這樣的結構如果跑通,既能維持低門檻普及,也能讓高消耗、高價值場景承擔一部分商業成本。價值不只在收入,而在重塑入口對於字節來說,豆包專業版的意義,也還不止於新增一檔收入這麼簡單。它首先改變了對 AI 助手的評價標準。過去,用戶評價一個 AI 產品,常常看單次回答質量,回答準不準?寫得好不好?專業版把評價標準轉向“能否完成任務”,能不能拆任務?能不能調工具?能不能處理文件?這會把競爭從單純模型能力,拉到產品系統能力。AI 助手的其它玩家能不能跟上,有沒有實力跟上?模型只是底座。真正決定體驗的,還包括工具調用、文件系統、瀏覽器操作、辦公套件、權限控制、協作鏈路、任務穩定性,以及失敗後的可恢復能力。而且豆包專業版也是一次入口爭奪。很多專業工作並不是從“我要和 AI 聊天”開始,而是從“我要寫一份報告”,“我要整理一批文件”開始。如果豆包能把這些任務直接承接下來,它就不再只是一個聊天入口,而會變成生產力入口。這對字節也具有重要戰略價值。豆包原本是面向大眾用戶的 AI 助手,飛書則是字節在辦公協作場景的重要產品。辦公任務模式把模型、工具、文件、文檔和協作連接起來,實際上是在把 C 端高頻使用,和生產力場景打通。用戶在豆包裡發起任務,成果進入飛書文檔、表格、PPT、網頁或本地文件,AI 助手就有機會嵌入真實工作鏈路。當然,目前的豆包專業版,還不是一個已經完成的終局產品。根據字節提供的信息,豆包後續仍有更多的更新可以期待。這類 Agent 生產力產品要真正成熟,還需要持續解決幾個問題:任務執行的穩定性、複雜任務的可控性、本地操作的安全授權、引用來源的可追溯性,以及專業場景下的責任邊界。但方向已經清楚了。豆包專業版的推出,標誌著國內大眾 AI 助手開始從“普及型免費工具”走向“分層生產力平臺”。如果辦公任務模式能夠在真實場景裡穩定交付,豆包專業版的價值就不只是多了一個訂閱套餐,而是讓 AI 助手第一次更明確地站到了生產力的主入口位置。雷峰網雷峰網雷峰網

Related

相關文章

鈦媒體生成式AI

GPT設計GPT

這篇消息聚焦「GPT設計GPT」。原始導語提到:如果說英偉達賣鏟子,那麼OpenAI想擁有礦山。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛
雷峰網生成式AI

GAIR Paper 107|高校聯合騰訊發佈 GameCraft-Bench:AI已能端到端開發遊戲,Claude Opus 四成達到可玩水平

Coding Agent 的下一站,是動態交互系統的構建。 作者丨GameCraft-Bench Team 過去一年,代碼智能體(Coding Agent)發展迅速。從編寫簡單的單一腳本、修復局部 BUG,到跨文件完成長序開發任務,模型能力正在不斷提升。以“一句話生成遊戲”為代表,AI 正在大幅降低遊戲構建門檻。過去需要開發者熟練掌握引擎架構、手寫邏輯代碼的開發工作,現在可以通過自然語言快速生成原型,甚至生成可運行的遊戲項目。這也讓規模化由 AI 創造交互式體驗變得前所未有地現實。但問題是:這些從零自動生成的遊戲,真的“能玩”嗎?如果生成的代碼只是“看起來邏輯合理”,但在真實的引擎環境中根本跑不起來,或者視覺表現與玩家交互一塌糊塗,那麼在這些只看靜態代碼的基準裡刷出高分的 Agent,就很難真正勝任現實中的遊戲開發場景。香港中文大學(深圳)、深圳河套學院等高校聯合騰訊的最新研究 GameCraft-Bench 正是要解決這個問題:如何構建一個基於真實遊戲引擎、產物完整可運行、且能通過真實玩家多模態交互來驗證的 AI 遊戲生成評測基準。論文鏈接:https://arxiv.org/abs/2606.17861項目主頁:https://tongxuluo.github.io/gamecraft-bench-website評估代碼:https://github.com/tongxuluo/gamecraft-bench01為什麼不直接用現有的評測基準?過去已經提出了一些與遊戲生成相關的評估基準,那我們為什麼還要重新確立一個新的評估基準 GameCraft-Bench 呢?核心原因是:現有的基準很難全面、真實地衡量端到端的可玩性。表. GameCraft-Bench與已有的遊戲生成評估基準的對比。1. 真實引擎的整合難度被低估。 像 OpenGame-Bench 主要針對 Web

4 小時前
雷峰網生成式AI

元點Zeroth迎來拉美首秀 全球首款自主回充機器人掀起全球具身新熱潮

從巴西展會走向全球家庭 元點Zeroth持續引領全球具身智能落地應用2026年6月22日,巴西聖保羅——當消費級機器人逐步從實驗室走向真實家庭,具身智能產業正在進入全球化落地的關鍵階段。全球具身智能全棧品牌元點Zeroth正式亮相拉丁美洲規模最大、影響力最強的消費電子展會 Eletrolar Show 2026,首次向拉美市場展示其面向未來家庭生活打造的完整消費級具身智能產品矩陣。此次亮相不僅標誌著元點Zeroth全球化佈局的重要一步,也意味著具身智能正在從“功能設備”向“家庭智能體”加速演進。元點Zeroth 創始人兼 CEO 郭人傑表示:“在 Zeroth,我們的使命是引領具身智能的全球創新與應用。拉丁美洲市場正處於變革前夜,擁有巨大的技術潛力,能夠顯著提升人們的日常生活質量。通過讓先進技術變得更易獲取、更易使用,我們希望賦能整個地區的社區,重新定義未來人們如何藉助具身 AI 生活與工作。”本次參展,元點Zeroth 以前沿具身智能全棧產品矩陣首次進入拉美市場,展示其在家庭服務機器人、移動智能助手、核心執行器等領域的最新突破,標誌著其全球化佈局邁出關鍵一步。M1家庭人形機器人:全球首款“自主回充”的家庭人形機器人本次展會最受關注的產品,是元點Zeroth最新發布的家庭人形機器人 M1。M1專為家庭環境設計,機身高度約50cm,是一款面向真實生活場景的具身智能家庭終端。M1實現了全球首個家庭人形機器人的自主能源閉環能力這一重大突破。當電量不足時,M1能夠自主完成移動、路徑規劃,並通過小車完成自動回充過程,從而減少對人工充電與外部幹預的依賴。這一能力使機器人從“需要照顧的設備”,首次邁向“具備自維護能力的智能體”。無論是面對多孩家庭還是老年獨居場景,M1的多模態感知與持續學習的能力,使其可在日常生活中承擔包括生活提醒、基礎陪伴、家庭節奏協助以及個性化互動等多種角色,使其逐步

5 小時前
雷峰網生成式AI

ICML 2026 | 面向視覺語言模型的語義魯棒性認證

原文作者:公眾號“專知”原文鏈接:https://mp.weixin.qq.com/s/8GZParVJfj9fBuflTFTzlA 雷峰網轉載ICML 2026 | 面向視覺語言模型的語義魯棒性認證:用文本提示刻畫可證的語義變化區間論文題目:Semantic Robustness Certification for Vision-Language Models論文鏈接:https://arxiv.org/abs/2606.18839論文作者:Peiyu Yang、Paul Montague、Feng Liu、Andrew C. Cullen、Amardeep Kaur、Christopher Leckie、Sarah M. Erfani論文機構:The University of Melbourne、Defence Science and Technology Group代碼地址:https://github.com/ypeiyu/vlm-semantic-cert視覺語言模型(VLM)已經成為開放詞表識別、圖文檢索、檢測、分割和視覺問答等任務的基礎組件。但在真實應用中,輸入圖像經常發生語義層面的變化:物體形狀變了、尺寸變了、風格變了、背景變了、視角變了、光照變了。傳統魯棒性認證多關注像素擾動、幾何變換或生成模型潛空間變化,很難直接回答一個更貼近日常部署的問題:當圖像沿著某個“語義方向”變化時,VLM 的預測在多大範圍內保持不變?這篇 ICML 2026 論文提出了一個新的語義魯棒性認證框架。核心想法非常漂亮:利用 VLM 的開放詞表能力,把文本提示作為語義代理,用一對 source/target prompt 在圖文共享嵌入空間中定義語義變化方向;再利用 VLM 分類器決策邊界的閉式幾何結構,精確計算預測類別保持不變的 semantic extent interval。

6 小時前