花1500美元,讓AI“黑”自己的App:GPT-5.5成功率70%,部分模型0分交卷

重點摘要
## 花1500美元請AI當駭客:GPT-5.5成功率高達七成,部分模型直接繳白卷 近期一項針對大型語言模型「自動化滲透測試」能力的研究引發關注。研究團隊設計了一個專門用來評估AI模型尋找軟體漏洞的「Bug靶場」,並邀請多個主流模型嘗試攻擊一款由AI生成的應用程式。結果顯示,只要付出約1,500美元的成本,GPT-5.
## 花1500美元請AI當駭客:GPT-5.5成功率高達七成,部分模型直接繳白卷
近期一項針對大型語言模型「自動化滲透測試」能力的研究引發關注。研究團隊設計了一個專門用來評估AI模型尋找軟體漏洞的「Bug靶場」,並邀請多個主流模型嘗試攻擊一款由AI生成的應用程式。結果顯示,只要付出約1,500美元的成本,GPT-5.5就能成功找出並利用其中七成的漏洞;但也有部分模型完全無法完成任務,等於拿到零分成績。這項實驗揭露了當前AI模型在資安攻防上的巨大落差,也讓「用AI對抗AI」的防禦策略再度成為焦點。
所謂的「Bug靶場」,其實是一個刻意埋入多種程式弱點的測試環境,目的是檢驗AI模型能否自主執行「紅隊演練」——也就是模擬駭客行為,嘗試入侵、提權或竊取資料。過去這類工作大多依賴人類資安專家手動進行,成本高且耗時。而這次實驗中,研究團隊讓AI模型扮演攻擊者,目標是攻破一個同樣由AI生成的應用程式;模型需要自行理解程式架構、發現漏洞,並撰寫攻擊腳本。GPT-5.5在多次測試中成功觸發了七成以上的漏洞,而且每次嘗試的成本僅約1,500美元,遠低於聘請人類專家的費用。
相較之下,部分模型表現極為慘淡。像是某些較小型的開源模型,或是未針對推理與工具使用進行優化的版本,在靶場中幾乎完全找不到有效弱點,甚至連基本的掃描指令都無法正確執行,最終以零分收場。這也凸顯出不同AI模型在「程式理解」「邏輯推理」與「自主決策」上的顯著差距。並非所有語言模型都具備當駭客的潛力,只有那些經過大量程式碼訓練、並具備高階規劃能力的模型才能勝任。
這項實驗的背景,與當前軟體開發流程全面導入AI輔助的趨勢息息相關。許多企業開始讓AI自動撰寫程式碼、生成API或建立完整的前後端應用,但這些由AI產出的軟體往往也帶有特殊的安全缺陷。如果攻擊方可以輕易利用另一個AI來掃描並入侵這些系統,那麼開發者就必須重新思考防禦策略。另一方面,這也帶來了正向的可能性:企業可以雇用AI模型定期對自己的產品進行自動化滲透測試,以相對低廉的成本持續找出弱點,甚至在駭客下手前先行修補。
從影響層面來看,這項結果對資安產業與軟體開發者都有深遠意義。首先,資安工程師的工作模式可能發生轉變——未來紅隊演練不再完全依賴人工,而是由人類設定目標後,交由AI模型批次執行。其次,模型提供者需要更謹慎地管控模型的能力邊界,避免被惡意使用者直接拿來發動大規模自動化攻擊。最後,開發AI生成程式的廠商也必須建立更嚴格的測試規範,確保自己的模型不會產出容易被另一套模型攻破的脆弱程式碼。
對於一般讀者與企業技術決策者而言,後續有幾個方向值得關注。第一,各大AI實驗室是否會推出「反制版本」——例如訓練專門偵測攻擊行為的防禦型模型,或是在模型輸出層加上安全濾網。第二,是否有新創公司或開源社群以此為基礎,開發出低成本的AI滲透測試服務,讓中小企業也能負擔得起。第三,監管機構可能開始討論:是否應該限制頂尖模型的自動攻擊能力,或是要求模型供應商對這類功能進行強制評測。無論如何,「AI攻擊AI」不再是科幻情節,而是現在進行式。開發者最好趁早為自己的應用程式安排一場由AI主導的壓力測試,否則未來可能連自己的App怎麼被「黑」進來的都搞不清楚。
Related
相關文章

AI預測不了“佛得角”
AI預測模型在世界盃足球賽預測中集體失準,特別是對非洲隊伍「佛得角」的表現完全錯估,凸顯大模型在面臨動態不確定性與非主流聯賽數據不足時的脆弱性。這場預測翻車事件引發外界對AI可信度的質疑,也促使科技公司反思如何修正模型,導入即時動態資訊以提升預測準確度。

智能家居終於“智能”了!有記憶、能認人的“賈維斯”,小米先交卷了
{"id":"bfc7e789-db52-4597-89dc-85a30161bd27","object":"response","model":"deepseek-v4-flash","output":[],"stop_reason":"max_output_tokens","usage":{"input_tokens":158,"output_tokens":1400,"total_to...

AI 讓獨立遊戲更容易做出來,也更容易死在 Steam 裡
AI 降低了獨立遊戲的生產門檻,也放大了 Steam 供給過剩和玩家信任危機。獨立遊戲的競爭,正在從“能不能做出來”,轉向“能不能被看見、被相信、被持續選擇”。當工具讓內容越來越容易生成,真正稀缺的反而是人的表達、真實反饋、發行篩選與社區信任。

全球首個 AI 藝術博物館:谷歌協力打造,生成 12 億像素超現實畫面
谷歌昨日(6 月 18 日)發佈博文,宣佈攜手藝術家 Refik Anadol,在洛杉磯打造全球首個 AI 藝術博物館 Dataland,將於明日(6 月 20 日)開館。

八部門聯合發文力推“人工智能 + 消費”,擴大 AI 手機電腦及智能網聯汽車消費
商務部等八部門聯合印發《關於加快“人工智能 + 消費”發展的實施意見》,提出 5 方面 17 條舉措,旨在擴大智能產品消費、賦能服務消費、創新消費場景。政策將推動人工智能與消費深度融合,促進 AI 進千家萬戶。#人工智能消費新政##AI 手機電腦##智能網聯汽車#

魔法原子牽手萬機易租,全棧產品入駐2.0平臺共建租賃生態
這篇消息聚焦「魔法原子牽手萬機易租,全棧產品入駐2.0平臺共建租賃生態」。原始導語提到:全系產品入駐萬機易租2.0 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。