花1500美元，讓AI“黑”自己的App：GPT-5.5成功率70%，部分模型0分交卷

2026年6月4日 16:05

重點摘要

## 花1500美元請AI當駭客：GPT-5.5成功率高達七成，部分模型直接繳白卷近期一項針對大型語言模型「自動化滲透測試」能力的研究引發關注。研究團隊設計了一個專門用來評估AI模型尋找軟體漏洞的「Bug靶場」，並邀請多個主流模型嘗試攻擊一款由AI生成的應用程式。結果顯示，只要付出約1,500美元的成本，GPT-5.

站內 AI 整理稿

## 花1500美元請AI當駭客：GPT-5.5成功率高達七成，部分模型直接繳白卷

近期一項針對大型語言模型「自動化滲透測試」能力的研究引發關注。研究團隊設計了一個專門用來評估AI模型尋找軟體漏洞的「Bug靶場」，並邀請多個主流模型嘗試攻擊一款由AI生成的應用程式。結果顯示，只要付出約1,500美元的成本，GPT-5.5就能成功找出並利用其中七成的漏洞；但也有部分模型完全無法完成任務，等於拿到零分成績。這項實驗揭露了當前AI模型在資安攻防上的巨大落差，也讓「用AI對抗AI」的防禦策略再度成為焦點。

所謂的「Bug靶場」，其實是一個刻意埋入多種程式弱點的測試環境，目的是檢驗AI模型能否自主執行「紅隊演練」——也就是模擬駭客行為，嘗試入侵、提權或竊取資料。過去這類工作大多依賴人類資安專家手動進行，成本高且耗時。而這次實驗中，研究團隊讓AI模型扮演攻擊者，目標是攻破一個同樣由AI生成的應用程式；模型需要自行理解程式架構、發現漏洞，並撰寫攻擊腳本。GPT-5.5在多次測試中成功觸發了七成以上的漏洞，而且每次嘗試的成本僅約1,500美元，遠低於聘請人類專家的費用。

相較之下，部分模型表現極為慘淡。像是某些較小型的開源模型，或是未針對推理與工具使用進行優化的版本，在靶場中幾乎完全找不到有效弱點，甚至連基本的掃描指令都無法正確執行，最終以零分收場。這也凸顯出不同AI模型在「程式理解」「邏輯推理」與「自主決策」上的顯著差距。並非所有語言模型都具備當駭客的潛力，只有那些經過大量程式碼訓練、並具備高階規劃能力的模型才能勝任。

這項實驗的背景，與當前軟體開發流程全面導入AI輔助的趨勢息息相關。許多企業開始讓AI自動撰寫程式碼、生成API或建立完整的前後端應用，但這些由AI產出的軟體往往也帶有特殊的安全缺陷。如果攻擊方可以輕易利用另一個AI來掃描並入侵這些系統，那麼開發者就必須重新思考防禦策略。另一方面，這也帶來了正向的可能性：企業可以雇用AI模型定期對自己的產品進行自動化滲透測試，以相對低廉的成本持續找出弱點，甚至在駭客下手前先行修補。

從影響層面來看，這項結果對資安產業與軟體開發者都有深遠意義。首先，資安工程師的工作模式可能發生轉變——未來紅隊演練不再完全依賴人工，而是由人類設定目標後，交由AI模型批次執行。其次，模型提供者需要更謹慎地管控模型的能力邊界，避免被惡意使用者直接拿來發動大規模自動化攻擊。最後，開發AI生成程式的廠商也必須建立更嚴格的測試規範，確保自己的模型不會產出容易被另一套模型攻破的脆弱程式碼。

對於一般讀者與企業技術決策者而言，後續有幾個方向值得關注。第一，各大AI實驗室是否會推出「反制版本」——例如訓練專門偵測攻擊行為的防禦型模型，或是在模型輸出層加上安全濾網。第二，是否有新創公司或開源社群以此為基礎，開發出低成本的AI滲透測試服務，讓中小企業也能負擔得起。第三，監管機構可能開始討論：是否應該限制頂尖模型的自動攻擊能力，或是要求模型供應商對這類功能進行強制評測。無論如何，「AI攻擊AI」不再是科幻情節，而是現在進行式。開發者最好趁早為自己的應用程式安排一場由AI主導的壓力測試，否則未來可能連自己的App怎麼被「黑」進來的都搞不清楚。

原始來源：36氪 ↗

查看原始來源

鈦媒體AI應用場景

AI預測不了“佛得角”

AI預測模型在世界盃足球賽預測中集體失準，特別是對非洲隊伍「佛得角」的表現完全錯估，凸顯大模型在面臨動態不確定性與非主流聯賽數據不足時的脆弱性。這場預測翻車事件引發外界對AI可信度的質疑，也促使科技公司反思如何修正模型，導入即時動態資訊以提升預測準確度。

剛剛閱讀分析

智東西AI應用場景

智能家居終於“智能”了！有記憶、能認人的“賈維斯”，小米先交卷了

{"id":"bfc7e789-db52-4597-89dc-85a30161bd27","object":"response","model":"deepseek-v4-flash","output":[],"stop_reason":"max_output_tokens","usage":{"input_tokens":158,"output_tokens":1400,"total_to...

剛剛閱讀分析