獨家專訪|蘇煒傑加入OpenAI:Scaling Law撞牆後為什麼需要數學家出手?
重點摘要
大模型正在走進一片沒有地圖的深水區。Scaling Law開始撞牆、高質量數據接近枯竭、AI解釋性問題依然沒有解決,行業逐漸進入後Scaling時代。越來越多人開始意識到,那些最關鍵的瓶頸,單靠工程經驗已經無法突破了。問題擺在眼前,能回答它的人開始登場。5月30日,賓夕法尼亞大學沃頓商學院統計學教授蘇煒傑宣佈加入OpenAI,參與模型訓練相關工作。他是2026 COPSS會長獎得主,統計學界40歲以下最高榮譽14年來第一位華人獲得者,剛剛完成從副教授到正教授的晉升。站在學術生涯的頂峰時刻,他卻轉身走進行業最深處的風暴眼。時機不像是巧合。契機:去年十二月的一通視頻蘇煒傑告訴雷峰網,促成他這次加入OpenAI的直接契機,是去年12月的一通Zoom視頻。“OpenAI 的研究員 Sebastien Bubeck 聯繫了我,問我有沒有興趣加入OpenAI。很多年前他還在學術界時,就關注過我在優化問題方面的工作。”一句話,藏著兩條信息。一是OpenAI對理論研究的關注並非新近才有。二是蘇煒傑在優化領域的工作,在AI圈早已廣受關注。蘇煒傑的學術履歷橫跨高維統計、機器學習理論、因果推斷、差分隱私與生成式AI。2007年,他考入北大數院,以年級第一畢業,隨後赴斯坦福統計系,師從統計學傳奇人物Emmanuel Candès。這般紮實的學術背景,從根本上塑造了他看待問題的方式:尋找複雜系統裡的結構,而不只是得出一個可運行的結果。國內數學圈,常把蘇煒傑所在的北大數院2007級稱為“黃金二代”。這一級出了蘇煒傑、鄧煜、王虹、唐雲清等後來橫跨數學、統計、AI前沿的優秀學者。對此,蘇煒傑有他自己的解讀,既不誇大,也不迴避。“回想起來,我們這一級確實很強,在北大時已經展現出日後的潛力,只是當時沒有意識到。”他認為,其實北大數院前後幾個年級都非常出色,很大原因來自北大數學培養模式的成功,以及一群真正對數學
大模型正在走進一片沒有地圖的深水區。Scaling Law開始撞牆、高質量數據接近枯竭、AI解釋性問題依然沒有解決,行業逐漸進入後Scaling時代。越來越多人開始意識到,那些最關鍵的瓶頸,單靠工程經驗已經無法突破了。問題擺在眼前,能回答它的人開始登場。5月30日,賓夕法尼亞大學沃頓商學院統計學教授蘇煒傑宣佈加入OpenAI,參與模型訓練相關工作。他是2026 COPSS會長獎得主,統計學界40歲以下最高榮譽14年來第一位華人獲得者,剛剛完成從副教授到正教授的晉升。站在學術生涯的頂峰時刻,他卻轉身走進行業最深處的風暴眼。時機不像是巧合。契機:去年十二月的一通視頻蘇煒傑告訴雷峰網,促成他這次加入OpenAI的直接契機,是去年12月的一通Zoom視頻。“OpenAI 的研究員 Sebastien Bubeck 聯繫了我,問我有沒有興趣加入OpenAI。很多年前他還在學術界時,就關注過我在優化問題方面的工作。”一句話,藏著兩條信息。一是OpenAI對理論研究的關注並非新近才有。二是蘇煒傑在優化領域的工作,在AI圈早已廣受關注。蘇煒傑的學術履歷橫跨高維統計、機器學習理論、因果推斷、差分隱私與生成式AI。2007年,他考入北大數院,以年級第一畢業,隨後赴斯坦福統計系,師從統計學傳奇人物Emmanuel Candès。這般紮實的學術背景,從根本上塑造了他看待問題的方式:尋找複雜系統裡的結構,而不只是得出一個可運行的結果。國內數學圈,常把蘇煒傑所在的北大數院2007級稱為“黃金二代”。這一級出了蘇煒傑、鄧煜、王虹、唐雲清等後來橫跨數學、統計、AI前沿的優秀學者。對此,蘇煒傑有他自己的解讀,既不誇大,也不迴避。“回想起來,我們這一級確實很強,在北大時已經展現出日後的潛力,只是當時沒有意識到。”他認為,其實北大數院前後幾個年級都非常出色,很大原因來自北大數學培養模式的成功,以及一群真正對數學感興趣的同學聚在一起產生的群體激勵效應。“對我而言,我的底色是數學。數學訓練給人的不是某個固定工具,而是在複雜問題裡尋找結構的能力。”但他也強調,自己並非一開始就奔著應用方向去的。“因為各種機緣巧合,我本科時在微軟亞洲研究院的實習,之後到斯坦福讀博,比較早的接觸到了機器學習和人工智能,這些經歷奠定了我日後做應用數學研究的學術品味。”提及當下去向選擇,他的回答十分坦誠。“到了我這個職業階段,身邊很多學術界的朋友已經在創業。”但他選擇投身OpenAI的原因,還是讓人好奇。蘇煒傑解釋道,很多自己長期關心的基礎問題,今天正在大模型最前沿以非常真實、非常大規模的方式出現。“在學校,我們組提出過不少關於AI算法的想法,但受限於算力和Infra,很難做大規模的實驗驗證。而在Frontier Lab,就沒有這些問題。”這番回答,傳遞出了一個清晰的思考。他去OpenAI,不是為了離開學術,而是為了把學術問題研究做得更徹底,更多觀點,歡迎添加作者微信IHAVEAPLANB-溝通交流。OpenAI為什麼需要數學家?談及入職OpenAI後負責的具體內容,蘇煒傑表示暫時不便透露。但他堅信,未來理論功底不錯的人,開發AI模型的優勢會被放大。蘇煒傑的判斷,主要基於兩個原因:第一,Frontier Lab的Infra已經比較成熟,Coding Agent在研發中已經普及使用。“這並不是說工程能力不重要,而是工程能力的重心發生了變化,idea的重要性會提升。稀缺的是提出好假設、設計好實驗、定義好eval、及時的反饋、並判斷能不能scale的能力。”第二,大模型的性能提升已經進入深水區。“普通對話能力對各家來說都已經飽和,拉開差距的突破點,在於高難度任務在複雜環境下能力的穩健性。這個時候,對數據的深刻理解會變得尤為重要,特別是對數據分佈、泛化能力、和評估不確定性的洞察。”他表示,也正是由於上述原因,現在有越來越多的統計學家、應用數學家、和物理學家活躍在 AI 領域。蘇煒傑所描述的不是一個人的職業判斷,而是整個行業正在發生的能力重心遷移,不同見解,歡迎添加作者微信IHAVEAPLANB-溝通交流。過去三年,AI行業最核心的競爭,在於誰擁有更多GPU、更大的數據中心、更強的工程團隊。但是在今天,新的問題正在浮現。對齊稅怎麼算?合成數據的崩潰風險如何量化?訓練過程的收斂性能不能被嚴格證明?......這些問題,已經逐漸超出傳統工程優化能夠解釋的範圍,越來越像數學問題。他關心的問題,正是大模型頭疼的問題在採訪蘇煒傑之前,雷峰網梳理了他過去幾年的論文方向,發現一個有趣的現象:他的研究重點,與當下大模型在訓練和應用中遇到的某些瓶頸高度相關。這並非巧合,兩條路徑都指向了同一個核心問題,不確定性。統計學研究的本質就是處理不確定性,而今天的大模型,恰恰建立在諸多不確定性之上。以下是他對幾個核心問題的判斷:Scaling Law真的存在絕對上限嗎?硅谷過去幾年篤信Scaling Law,認為算力、數據、參數只要指數級堆上去,AGI就會自然湧現。但當下,回報率在下降的信號越來越明顯,Scaling Law真的要撞牆了嗎?這個問題蘇煒傑兩年前就思考過,他認為不會有一個完備答案。“算力和參數量相對是良定義的,但數據不是一個良定義的單一變量。兩份同樣大小的數據,信息密度、任務結構、長尾覆蓋、可驗證性可能完全不同,Scaling Law可能在一個數據上成立,而另一個不成立。”他還指向了一個被很多人忽略的維度。“因為AI引擎的普及,這個世界產生數據的速度比任何時期都快。真正的問題是,這些新生成數據的智力密度,和早期更自然、更原生的數據相比,能不能維持模型能力繼續scale上去,這個問題需要實證研究。”對齊稅在數學上有解法嗎?越對齊越變笨,是眼下AI行業最令人頭疼的問題之一。為了讓模型符合人類的安全和道德規範,RLHF(人類反饋強化學習)會破壞模型的微觀數據分佈,導致推理和生成能力下降。這就好比你讓一個天生自由奔跑的機器狗學會走直線,它的速度和敏捷性不可避免地會受到限制,這就是所謂的對齊稅。那麼這個問題真的無解嗎?“‘對齊稅’直覺上很容易理解,沒有兩全其美的事,不同指標之間確實存在一定此消彼長。但越對齊越變笨一定程度上是可以緩解的。隨著模型能力增強,對齊對能力下降的影響是可以降低的。”蘇煒傑表示。至於有沒有可能在數學層面推導出一個完美邊界,他打了一個物理學的比方:“大模型由於規模巨大、結構複雜,其實有點像一個巨大的物理系統。理論比較容易成功指導的,往往是微觀和宏觀兩個尺度:微觀上,像Muon優化器這類方向;宏觀上,比如Scaling Law。”蘇煒傑認為,真正難的是介於二者之間的中間尺度,那裡有數據、模型、任務和人類反饋的複雜相互作用。就像物理在高能粒子物理和宇宙學上很成功,但對介觀尺度的生物系統解釋起來難度很大。“有志於為 AI 建立有實際指導價值理論框架的同學,可以參考這個物理類比。”合成數據這條路走得通嗎?當人類高質量數據被大模型吃光,行業開始大規模用AI生成的合成數據訓練下一代模型。隨之而來的警告是,這也許會導致模型崩潰。對這個問題,蘇煒傑的判斷乾脆利落。他認為,模型崩潰主要來自直接、不加任何處理地反覆使用合成數據。從理論上講,這幾乎是必然的。因為反覆直接用合成數據,AI模型就成了一個沒有跟真實世界互動的封閉系統。“這樣的話數據分佈就會越來越窄,借用一個不完全嚴格的說法,這有點像熵增,封閉系統最終會走向退化。”但蘇煒傑認為,這並不意味著合成數據這條路走不通,更多一手採訪資料,歡迎添加作者微信IHAVEAPLANB-溝通交流。“關鍵不在於數據是不是AI生成的,而在於生成和篩選數據時有沒有加入外部信息。現在已經有很多工作在研究,怎樣在合成數據時小心地加入人類先驗和環境反饋,這樣合成數據就成了一個帶反饋的開放系統。”思維鏈真的能讓模型更理性嗎?思維鏈帶來的模型推理躍升,在很多人眼裡仍然是個謎。蘇煒傑直言,他曾經甚至想過思維鏈的反面:能不能減少token,要求模型直接輸出答案,通過提高訓練難度來提升模型推理能力。現在看,這個想法可能是錯的。“因為很多複雜問題裡,正確答案未必以一個很清晰的形式存在,需要通過大量思考找到相對合理的答案;即使正確答案存在,也往往需要經過很多看起來不正確的路徑,最後才能找到。”對此,他給出了一個偏哲學的解讀:“這是世界不完美、絕對理性不存在的一個例證。”AI正在拆掉“象牙塔”的高牆外界常有一種刻板印象,認為學術界和業界之間存在著一堵高牆。尤其是在AI這樣節奏極快的領域裡,兩者之間的文化摩擦似乎必然存在。蘇煒傑指出,其實美國高校“象牙塔”的圍牆,並沒有大家想象的那麼高。“學校經費大多來自政府和業界的資助,因此儘管學校層面賦予教授充分的自由,許多教授仍會自發地將科研與業界發展、尤其是AI緊密結合。即便是純數學領域,也有不少學者開始主動擁抱AI,這一點與歐洲學術界形成了鮮明對比。”從賓大沃頓到OpenAI,在他看來,雖然工作模式有所變化,但所追求的東西並沒有根本性不同。“就目前而言,AI的智能呈現出"博遠超人類,精不及專家"的特點。涉獵之廣遠超個人所能,但在專業縱深上尚不及頂尖的知識工作者。而學術界恰恰相反,精益求精有餘,廣博略顯不足,二者構成了極好的互補。”蘇煒傑預計,未來 AI 的持續進化,尤其是專業領域能力的進一步提升,將離不開與學術界的深度協作。這種互補,或許也是理解他這次選擇的另一個角度。“象牙塔”並沒有倒,但它和外部世界之間的通道,正在變得越來越寬。當一位統計學家決定走進風暴眼,他看到的,或許正是那些工程師還沒來得及定義的問題。注:文中所載蘇煒傑觀點僅代表個人立場,不代表 OpenAI 官方立場。本文作者長期追蹤海外AI行業動態,更多深度信息,歡迎添加作者微信IHAVEAPLANB-溝通交流。
Related
相關文章

GPT5.6慘遭切腦,Fable 5迴歸要變弱雞版?
這篇消息聚焦「GPT5.6慘遭切腦,Fable 5迴歸要變弱雞版?」。原始導語提到:美國AI,「閉關鎖國」? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

Anthropic最新報告摸透全球打工人:凌晨5點求睡眠,晚6點問菜譜
這篇消息聚焦「Anthropic最新報告摸透全球打工人:凌晨5點求睡眠,晚6點問菜譜」。原始導語提到:白天,Claude是高薪打工人的生產力引擎;深夜,它成了唯一知道你還醒著的那個。一份報告,意外照出了幾百萬人藏起來的24小時。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

獨家|獲超億美元融資,Sand.ai 曹越:為什麼視頻是通往世界模型最重要的路徑
這篇消息聚焦「獨家|獲超億美元融資,Sand.ai 曹越:為什麼視頻是通往世界模型最重要的路徑」。原始導語提到:“每一代模型,我們都在押注一個非共識。” 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

北京太空算力創新中心揭牌成立,統籌組織星載 AI 芯片、太空大模型等聯合研發
這篇消息聚焦「北京太空算力創新中心揭牌成立,統籌組織星載 AI 芯片、太空大模型等聯合研發」。原始導語提到:北京太空算力創新中心採用“公司 + 聯盟”雙輪驅動模式,運營主體為北京天算星聯科技有限公司。創新中心承擔四類核心職能。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。
讓AI自己修服務器?先過了這場“火線測試”再說
智東西 作者 | 陳駿達 編輯 | 漠影 隨著大模型能力持續提升,智能體正從聊天、寫作等輔助場景走向軟件開發、網絡管理和基礎設施運維等生產環節。尤其在AI基礎設施領域,面對龐大的GPU集群和複雜架構,越來越多企業開始嘗試讓智能體承擔故障排查、告警分析和資源管理等工作,以提升運維效率並降低人力成本。 然而,運維場景對智能體構成了空前挑戰。AI算力集群運維橫跨GPU硬件、網絡通信、分佈式存儲、容器編排、訓練框架等多個技術棧,問題現象往往模糊、不完整甚至相互矛盾,智能體需要在開放環境中主動探索、反覆驗證,自行界定問題並尋求解決路徑。 要提升智能體在此類複雜場景的綜合能力,一套與之匹配的評測基準不可或缺。但當前行業恰恰缺乏對這種多步推理、開放決策過程的系統化評估能力,導致運維智能體研發長期“無標可依”,進展評估與方向校準均缺乏牽引。 正是在這樣的背景下,中國信息通信研究院開源了全球首個面向AI Infra運維場景的智能體評測基準——AISHPerf-智算運維智能體評測基準,國內頭部AI原生基礎設施企業無問芯穹重點參與技術建設。 這套基準源自百億條真實運維數據,不再只關注“會不會回答問題”,而是聚焦智能體“能不能解決問題”,為運維智能體能力評估提供了一套貼近真實生產環境的參考標準。 一、百億條運維數據,煉出103道“考題” 任何評測體系的價值,最終都建立在數據質量之上。對於運維智能體而言尤其如此。因為真實世界中的故障往往具有高度隨機性和複雜性,許多問題並不存在標準答案,甚至需要跨越多個技術棧進行聯合分析。如果評測數據脫離真實生產環境,即使得到再高的測試分數,也很難證明智能體具備實際應用價值。 無問芯穹之所以能夠重點參與這一評測基準的技術建設,與其在AI基礎設施領域的長期實踐密切相關。根據披露的信息,其早在2025年便已將運維智能體應用到實際訓練推理業務中,並取得明顯成效。工單平均處理
OceanBase發佈AI數據庫三件套,TOC最高降50%,螞蟻、靈光都在用
智東西 作者 | 王涵 編輯 | 雲鵬 智東西6月29日報道,今天,OceanBase發佈湖庫一體AI數據庫產品OceanBase Lakebase,該產品面向Agent應用,原生支持多模態數據管理。 “數據湖”是一種集中式存儲架構,可以存儲結構化、半結構化、非結構化等不同類型的數據。Lakebase融合了“數據湖”架構的開放性和“數據庫”架構的功能性,讓結構化數據、非結構化數據和向量數據能夠在統一架構中被管理、加工、檢索和調用。 基於此,OceanBase還發布了數據生產、治理和服務工作臺OceanBase DataStudio,以及面向經營分析和業務決策的數據智能Agent OceanBase DataPilot兩個產品。 OceanBase DataStudio覆蓋數據接入、數據加工、任務編排、語義建模、數據治理到Agent協作等環節,幫助企業把分散的數據資產轉化為可管理、可理解、可調用的數據服務。 OceanBase DataPilot作為統一的企業業務智能入口,讓業務人員可以通過自然語言完成分析報告、數據看板和可信答案生成,把過去依賴專業數據團隊完成的分析流程,轉化為可交互、可追問、可複用的智能決策能力。 智東西等媒體與OceanBase CEO楊冰、CTO楊傳輝,進行了面對面的交流。 楊冰認為,AI正在改變數據的管理方式,數據使用者和數據形態都發生了變化。數據使用者的改變帶來了三大挑戰:VibeCoding帶來了海量Agent應用;Agent開始執行生產任務;Agent長期運行的正確性和自我進化。數據形態改變,則為非結構化數據成為可計算資產、數據要主動流轉、數據要理解任務。 兩者作用疊加,OceanBase給出判斷:在AI時代,數據庫應該是湖庫一體的。 OceanBase內部的AI轉型也在進行中。楊冰透露,OceanBase已將內核團隊分為“一體化數據庫”和“A