微軟 Webwright 開源:網頁智能體從“點擊式”進化為“代碼式”
重點摘要
微軟研究院開源了網頁智能體框架Webwright,摒棄傳統“截圖/DOM點擊”模式,採用“終端優先”設計,讓AI模型直接在終端編寫Playwright代碼並執行Bash命令,以高效完成複雜網頁任務。框架代碼僅約1000行,核心架構極簡,強調終端操作優於抽象界面。
微軟研究院正式開源了名為 Webwright 的網頁智能體框架,最大的亮點是捨棄常見的「截圖點擊」或「DOM 節點操作」模式,轉而讓 AI 直接在終端編寫 Playwright 程式碼並執行 Bash 指令來操控瀏覽器。
這種「終端優先」的設計,使 AI 不再需要模擬人類的滑鼠或鍵盤動作,而是透過生成自動化腳本來完成登入、填表或資料擷取等複雜任務。相較於傳統方法,程式碼級的控制理論上更精準、更快速,也更容易處理動態網頁。
過去許多網頁智能體依賴視覺辨識或 DOM 樹解析,容易受到頁面佈局變動或渲染延遲的干擾。Webwright 則從根源切入,讓 AI 直接與瀏覽器自動化工具 Playwright 對話,等於跳過中間的圖像理解環節。
這項開源可能大幅降低開發自動化工具的門檻,讓非工程師也能透過自然語言描述需求,由 AI 自動產生對應的腳本。同時,對於需要大量重複操作的場景,例如資料爬蟲或測試腳本維護,效率可望顯著提升。
不過,這種模式也考驗 AI 對程式碼的生成能力與除錯邏輯,若執行過程中出現語法錯誤或網路狀態異常,仍需人類介入調整;安全性方面,允許 AI 執行 Bash 指令也需謹慎控管權限。
讀者後續可關注 Webwright 在 GitHub 上的社群貢獻,以及微軟是否會將其整合進自家 Copilot 生態。此外,未來是否能與其他瀏覽器自動化框架相容,也是值得觀察的方向。
整體而言,Webwright 代表網頁智能體從「模仿人類操作」邁向「AI 直接寫程式的自動化新階段」,為開發者提供一條更接近工程思維的捷徑。
Related
相關文章
網易有道全面向AI轉型 全場景Agent矩陣亮相圖博會
{"id":"39ef5947-b77a-4904-bf03-ff6264f08dc4","object":"response","model":"deepseek-v4-flash","output":[],"stop_reason":"max_output_tokens","usage":{"input_tokens":154,"output_tokens":200,"total_tokens":354}}
MosaicLeaks: Can your research agent keep a secret?
Back to Articles MosaicLeaks: Can your research agent keep a secret? Enterprise Article Published June 18, 2026 Upvote - Alexander Gurung agurung Follow ServiceNow Rafael Pardinas rafapi-snow Follow ServiceNow TL;DR Deep research agents increasingly combine private local documents with external tools like web retrieval, creating a privacy risk: an agent's external queries may leak sensitive information. MosaicLeaks proposes a new deep-research task with multi-hop questions that interleave public and private information. Across the models we tested, agents frequently leaked private information, and training only for task performance made it worse. We propose a mosaic-leakage-aware RL training method, Privacy-Aware Deep Research (PA-DR), which raises strict chain success (the share of chains

騰訊老兵+大廠00後新銳,碼上飛想做的不只是AI Coding
這篇消息聚焦「騰訊老兵+大廠00後新銳,碼上飛想做的不只是AI Coding」。原始導語提到:已接入華為鴻蒙生態 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

Agent引爆網盤大戰,騰訊、百度、阿里齊聚,這次爭的不再是下載速度
這篇消息聚焦「Agent引爆網盤大戰,騰訊、百度、阿里齊聚,這次爭的不再是下載速度」。原始導語提到:網盤成了Agent新基建。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

21年老牌企服公司的AI實驗:讓Agent跑一遍流程
這篇消息聚焦「21年老牌企服公司的AI實驗:讓Agent跑一遍流程」。原始導語提到:司盟企服接入騰訊雲WorkBuddy後,將海外郵件管理、審計理賬、訂單審核等高頻交付流程交給Agent先跑一遍 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
曹操出行宣佈啟動全面AI轉型,組織升級向AI原生公司邁進
曹操出行在2026國際汽車及供應鏈博覽會 上宣佈啟動全面AI轉型,併發布RoboX戰略,打造全球領先的物理AI移動科技平臺。與此同時,公司正式啟動組織升級,加快向AI原生公司邁進。為推動全面AI轉型,今年上半年,公司推進戰略聚焦,持續優化業務結構,主動收縮非核心業務,加快向AI原生公司轉型。