9天Claude Code重寫100萬行代碼、6755次提交,Bun完成史上最大AI重構後,開發者質疑:99.8%測試通過率,真的代表安全?

2026年6月8日 21:26
9天Claude Code重寫100萬行代碼、6755次提交,Bun完成史上最大AI重構後,開發者質疑:99.8%測試通過率,真的代表安全?

重點摘要

Anthropic 收購的開源專案 Bun 在 9 天內使用 Claude Code 重寫了 100 萬行程式碼,完成 6,755 次提交,創下史上最大規模的 AI 重構紀錄。然而,開發者對高達 99.8% 的測試通過率提出質疑,認為這並不一定代表程式碼的實際安全性。

站內 AI 整理稿

# 9天AI重寫100萬行程式碼!Bun完成史上最大重構,開發者質疑:99.8%測試通過真的安全?

## 事件始末:從Zig到Rust的AI閃電重寫

去年底,AI公司Anthropic(Claude背後的公司)併購了知名開源專案Bun,這起收購在當時就已引起開發者社群廣泛關注。根據官方說法,Anthropic看中的不僅是Bun作為高效能JavaScript執行環境的技術優勢,更是為了讓自家AI編碼工具Claude Code跑得更穩、更快,因為Claude Code本身就是用Bun編譯與分發的。

然而,真正震撼整個開源社群的,是在收購僅僅幾個月後發生的事。2026年5月14日,Bun官方將一條名為「Rewrite Bun in Rust」的PR正式合併進主分支。這不是一次普通的程式碼重構——這條PR帶來了超過100萬行由Rust重寫的程式碼,累計6755次提交,修改了超過2000個檔案,而且**幾乎全部由Claude Code這個AI智慧體在短短9天內獨立完成**。

更驚人的是,Bun團隊宣稱這次由AI主導的重寫版本,通過了既有測試套件99.8%的測試,各平台全數過關,效能表現與原版持平甚至略有提升,二進位檔案體積也縮小了數MB。創辦人Jarred Sumner更在社群上分享了一句話,讓許多人感到震撼:「我們已經好幾個月沒有親手寫程式碼了。」換句話說,支撐Bun多年的Zig語言實作,現在已經完全消失在程式碼庫中,取而代之的是一套由AI從頭到尾生成、人類幾乎沒有參與編寫的Rust系統。

## 99.8%測試通過,就代表安全?開發者社群炸鍋

這項「AI重寫基礎設施」的壯舉看似是一場巨大的勝利,也確實迅速席捲Hacker News等開發者論壇。但很快地,質疑聲浪就跟著浮上檯面。PR本身的讚數與倒讚數幾乎各佔一半,社群的焦點不再只是「AI能不能寫程式碼」,而是轉向一個更尖銳、更本質的問題:**當AI生成程式碼的速度遠遠超過人類審查程式碼的速度時,我們要怎麼證明這些程式碼真的值得信任?**

首先是「測試通過」這句話的意義遭到嚴格檢視。開發者指出,測試套件通過率只能證明新版本與舊版本在「已知行為的已知路徑」上行為一致,但它無法驗證邊界條件、錯誤路徑、併發場景下的狀態一致性,更無法驗證那些沒有被寫進測試用例、只活在原始開發者腦海中的設計約束。簡單來說,99.8%的測試通過率,只能說明「新程式碼沒有把已知的功能搞壞」,但完全不能證明新程式碼是安全的、優秀的、或甚至真正可維護的。

更令人不安的是數據背後的真實情況。這次Rust重寫雖然號稱是要解決記憶體安全性問題(這也是Rust語言最被推崇的優勢),但最終產出的程式碼中,包含了**超過一萬個unsafe程式碼區塊**。這個數字是類似規模專案的兩個數量級以上,意味著這套新系統實際上變成了「戴著Rust面具的手動記憶體管理」,並未真正獲得Rust語言承諾的安全保證。之所以會出現這種狀況,是因為AI採用的「忠實翻譯」策略:Claude Code只是逐行將Zig程式碼轉換為對應的Rust語法,而不是從架構層面重新設計,因此Zig年代的手動記憶體管理模式就被原封不動地搬進了Rust世界。

## 更大的問題:人類已經看不懂自己的程式碼了

當一個程式碼庫有6755次提交、超過100萬行程式碼,而且每一行都是由AI生成、沒有任何一位人類工程師完整讀過時,這已經不僅僅是「要不要相信測試數據」的問題,而是軟體工程底層邏輯面臨的根本挑戰。

Zig社群甚至發表了一封公開信,直指問題核心:「軟體工程有一條基本原則——你不應該讓你不理解的程式碼跑在生產環境。不是因為它一定有問題,而是因為當它出問題的時候,你根本不知道從哪裡開始找。」信中還指出,這條PR的審查者名單上,coderabbitai、claude等AI機器人列名其中,唯一的人類審查者則標註為「等待審查中」,意味著這個程式碼庫目前沒有任何一個人類真正完整讀過它。

**Claude寫的程式碼,由Claude來審查。** 這句話聽起來很未來,但背後透露的風險卻非常現實。當六個月後出現一個詭異的併發錯誤,或某個邊界條件在特定負載下觸發了無法重現的異常行為時,負責偵錯的工程師面對的將是一個沒有人真正理解的系統,因為程式碼的每一個環節都不是人類編寫的,人類甚至不知道當初AI為什麼要這樣寫。

## 誰來承擔風險?產業面臨的結構性變革

這場Bun重寫爭議,其實反映了整個AI編碼產業正在經歷的結構性轉變。根據一項針對開發者的調查,目前已有72%的開發者每天使用AI編碼工具,42%的程式碼已經由AI生成或輔助完成,然而卻有高達96%的開發者表示**不完全信任AI生成的程式碼**。換句話說,當AI從實驗工具變成開發基礎設施,真正的瓶頸早已不是「怎麼寫出更多程式碼」,而是「信任、品質與責任」三個環節。

Anthropic收購Bun的背景也值得玩味。事實上,Claude Code本身長期以來就面臨記憶體洩漏、執行卡頓、UI崩潰等問題——有使用者回報單個VSCode會話吃掉11.6GB記憶體,極端案例甚至達到50GB。而這些問題的根源,很大一部分可以追溯到Bun本身的runtime穩定性問題,最終形成了一個荒謬的循環:Claude Code被Bun的記憶體問題拖垮,然後Anthropic讓Claude去重寫Bun,而Bun再回頭支撐Claude Code。

換言之,Anthropic收購Bun後進行的這場AI重寫,本質上是一場「自己修自己的基礎建設」。當一家公司的旗艦AI編碼產品需要反過來收購一個底層執行環境來確保地基不塌陷時,這已經不僅僅是「優化」了——在某種意義上,這是在承認既有程式碼庫已經超出了團隊人力能夠有效修復的範圍。

## 讀者可關注的後續發展

### 📌 關注Bun的正式版發布

目前Rust版本的Bun尚在canary階段,團隊表示正式發布前還會進行更多優化與清理。使用者可以將版本鎖定在1.3.14(最後一個Zig版本)觀望後續發展,密切關注會不會有新的問題回報。

### 📌 AI程式碼審查與驗證工具的發展

Bun重寫案例暴露出的最大痛點——AI生成程式碼的速度遠超人類審查速度——正催生新一波技術需求。類似CRAFT、Legacy Architect等AI自治審查工具正在快速發展中,未來可能出現專為AI生成程式碼設計的驗證框架與品質閘門。

### 📌 法律與授權層面的動向

當100萬行程式碼全由AI生成時,其著作權歸屬問題也隨之浮現。目前各國司法實踐多不承認純AI生成內容的可著作權性,這意味著AI生成的程式碼可能落入公共領域。對於像Bun這樣依賴MIT開源授權的專案,這個問題的後續法律發展值得持續追蹤。

### 📌 Rust重寫後的實際效能與穩定性表現

AI重寫後的Rust版本號稱效能提升、體積縮小,但實際投入生產環境後的長期表現仍有待驗證。GitHub issue已開始累積一些Zig版本未出現的問題,這些反饋將是評估這次重寫成功與否的重要指標。

Related

相關文章

鈦媒體生成式AI

Edge AI Daily 早報(6月19日)

AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

3 小時前
智東西生成式AI

谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元

智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

23 小時前

微軟,考慮接入DeepSeek

這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

23 小時前