獨家專訪｜蘇煒傑加入OpenAI：Scaling Law撞牆後為什麼需要數學家出手？

2026年6月29日 06:39

重點摘要

站內 AI 整理稿

大模型正在走進一片沒有地圖的深水區。Scaling Law開始撞牆、高質量數據接近枯竭、AI解釋性問題依然沒有解決，行業逐漸進入後Scaling時代。越來越多人開始意識到，那些最關鍵的瓶頸，單靠工程經驗已經無法突破了。問題擺在眼前，能回答它的人開始登場。5月30日，賓夕法尼亞大學沃頓商學院統計學教授蘇煒傑宣佈加入OpenAI，參與模型訓練相關工作。他是2026 COPSS會長獎得主，統計學界40歲以下最高榮譽14年來第一位華人獲得者，剛剛完成從副教授到正教授的晉升。站在學術生涯的頂峰時刻，他卻轉身走進行業最深處的風暴眼。時機不像是巧合。契機：去年十二月的一通視頻蘇煒傑告訴雷峰網，促成他這次加入OpenAI的直接契機，是去年12月的一通Zoom視頻。“OpenAI 的研究員 Sebastien Bubeck 聯繫了我，問我有沒有興趣加入OpenAI。很多年前他還在學術界時，就關注過我在優化問題方面的工作。”一句話，藏著兩條信息。一是OpenAI對理論研究的關注並非新近才有。二是蘇煒傑在優化領域的工作，在AI圈早已廣受關注。蘇煒傑的學術履歷橫跨高維統計、機器學習理論、因果推斷、差分隱私與生成式AI。2007年，他考入北大數院，以年級第一畢業，隨後赴斯坦福統計系，師從統計學傳奇人物Emmanuel Candès。這般紮實的學術背景，從根本上塑造了他看待問題的方式：尋找複雜系統裡的結構，而不只是得出一個可運行的結果。國內數學圈，常把蘇煒傑所在的北大數院2007級稱為“黃金二代”。這一級出了蘇煒傑、鄧煜、王虹、唐雲清等後來橫跨數學、統計、AI前沿的優秀學者。對此，蘇煒傑有他自己的解讀，既不誇大，也不迴避。“回想起來，我們這一級確實很強，在北大時已經展現出日後的潛力，只是當時沒有意識到。”他認為，其實北大數院前後幾個年級都非常出色，很大原因來自北大數學培養模式的成功，以及一群真正對數學感興趣的同學聚在一起產生的群體激勵效應。“對我而言，我的底色是數學。數學訓練給人的不是某個固定工具，而是在複雜問題裡尋找結構的能力。”但他也強調，自己並非一開始就奔著應用方向去的。“因為各種機緣巧合，我本科時在微軟亞洲研究院的實習，之後到斯坦福讀博，比較早的接觸到了機器學習和人工智能，這些經歷奠定了我日後做應用數學研究的學術品味。”提及當下去向選擇，他的回答十分坦誠。“到了我這個職業階段，身邊很多學術界的朋友已經在創業。”但他選擇投身OpenAI的原因，還是讓人好奇。蘇煒傑解釋道，很多自己長期關心的基礎問題，今天正在大模型最前沿以非常真實、非常大規模的方式出現。“在學校，我們組提出過不少關於AI算法的想法，但受限於算力和Infra，很難做大規模的實驗驗證。而在Frontier Lab，就沒有這些問題。”這番回答，傳遞出了一個清晰的思考。他去OpenAI，不是為了離開學術，而是為了把學術問題研究做得更徹底，更多觀點，歡迎添加作者微信IHAVEAPLANB-溝通交流。OpenAI為什麼需要數學家？談及入職OpenAI後負責的具體內容，蘇煒傑表示暫時不便透露。但他堅信，未來理論功底不錯的人，開發AI模型的優勢會被放大。蘇煒傑的判斷，主要基於兩個原因：第一，Frontier Lab的Infra已經比較成熟，Coding Agent在研發中已經普及使用。“這並不是說工程能力不重要，而是工程能力的重心發生了變化，idea的重要性會提升。稀缺的是提出好假設、設計好實驗、定義好eval、及時的反饋、並判斷能不能scale的能力。”第二，大模型的性能提升已經進入深水區。“普通對話能力對各家來說都已經飽和，拉開差距的突破點，在於高難度任務在複雜環境下能力的穩健性。這個時候，對數據的深刻理解會變得尤為重要，特別是對數據分佈、泛化能力、和評估不確定性的洞察。”他表示，也正是由於上述原因，現在有越來越多的統計學家、應用數學家、和物理學家活躍在 AI 領域。蘇煒傑所描述的不是一個人的職業判斷，而是整個行業正在發生的能力重心遷移，不同見解，歡迎添加作者微信IHAVEAPLANB-溝通交流。過去三年，AI行業最核心的競爭，在於誰擁有更多GPU、更大的數據中心、更強的工程團隊。但是在今天，新的問題正在浮現。對齊稅怎麼算？合成數據的崩潰風險如何量化？訓練過程的收斂性能不能被嚴格證明？......這些問題，已經逐漸超出傳統工程優化能夠解釋的範圍，越來越像數學問題。他關心的問題，正是大模型頭疼的問題在採訪蘇煒傑之前，雷峰網梳理了他過去幾年的論文方向，發現一個有趣的現象：他的研究重點，與當下大模型在訓練和應用中遇到的某些瓶頸高度相關。這並非巧合，兩條路徑都指向了同一個核心問題，不確定性。統計學研究的本質就是處理不確定性，而今天的大模型，恰恰建立在諸多不確定性之上。以下是他對幾個核心問題的判斷：Scaling Law真的存在絕對上限嗎？硅谷過去幾年篤信Scaling Law，認為算力、數據、參數只要指數級堆上去，AGI就會自然湧現。但當下，回報率在下降的信號越來越明顯，Scaling Law真的要撞牆了嗎？這個問題蘇煒傑兩年前就思考過，他認為不會有一個完備答案。“算力和參數量相對是良定義的，但數據不是一個良定義的單一變量。兩份同樣大小的數據，信息密度、任務結構、長尾覆蓋、可驗證性可能完全不同，Scaling Law可能在一個數據上成立，而另一個不成立。”他還指向了一個被很多人忽略的維度。“因為AI引擎的普及，這個世界產生數據的速度比任何時期都快。真正的問題是，這些新生成數據的智力密度，和早期更自然、更原生的數據相比，能不能維持模型能力繼續scale上去，這個問題需要實證研究。”對齊稅在數學上有解法嗎？越對齊越變笨，是眼下AI行業最令人頭疼的問題之一。為了讓模型符合人類的安全和道德規範，RLHF（人類反饋強化學習）會破壞模型的微觀數據分佈，導致推理和生成能力下降。這就好比你讓一個天生自由奔跑的機器狗學會走直線，它的速度和敏捷性不可避免地會受到限制，這就是所謂的對齊稅。那麼這個問題真的無解嗎？“‘對齊稅’直覺上很容易理解，沒有兩全其美的事，不同指標之間確實存在一定此消彼長。但越對齊越變笨一定程度上是可以緩解的。隨著模型能力增強，對齊對能力下降的影響是可以降低的。”蘇煒傑表示。至於有沒有可能在數學層面推導出一個完美邊界，他打了一個物理學的比方：“大模型由於規模巨大、結構複雜，其實有點像一個巨大的物理系統。理論比較容易成功指導的，往往是微觀和宏觀兩個尺度：微觀上，像Muon優化器這類方向；宏觀上，比如Scaling Law。”蘇煒傑認為，真正難的是介於二者之間的中間尺度，那裡有數據、模型、任務和人類反饋的複雜相互作用。就像物理在高能粒子物理和宇宙學上很成功，但對介觀尺度的生物系統解釋起來難度很大。“有志於為 AI 建立有實際指導價值理論框架的同學，可以參考這個物理類比。”合成數據這條路走得通嗎？當人類高質量數據被大模型吃光，行業開始大規模用AI生成的合成數據訓練下一代模型。隨之而來的警告是，這也許會導致模型崩潰。對這個問題，蘇煒傑的判斷乾脆利落。他認為，模型崩潰主要來自直接、不加任何處理地反覆使用合成數據。從理論上講，這幾乎是必然的。因為反覆直接用合成數據，AI模型就成了一個沒有跟真實世界互動的封閉系統。“這樣的話數據分佈就會越來越窄，借用一個不完全嚴格的說法，這有點像熵增，封閉系統最終會走向退化。”但蘇煒傑認為，這並不意味著合成數據這條路走不通，更多一手採訪資料，歡迎添加作者微信IHAVEAPLANB-溝通交流。“關鍵不在於數據是不是AI生成的，而在於生成和篩選數據時有沒有加入外部信息。現在已經有很多工作在研究，怎樣在合成數據時小心地加入人類先驗和環境反饋，這樣合成數據就成了一個帶反饋的開放系統。”思維鏈真的能讓模型更理性嗎？思維鏈帶來的模型推理躍升，在很多人眼裡仍然是個謎。蘇煒傑直言，他曾經甚至想過思維鏈的反面：能不能減少token，要求模型直接輸出答案，通過提高訓練難度來提升模型推理能力。現在看，這個想法可能是錯的。“因為很多複雜問題裡，正確答案未必以一個很清晰的形式存在，需要通過大量思考找到相對合理的答案；即使正確答案存在，也往往需要經過很多看起來不正確的路徑，最後才能找到。”對此，他給出了一個偏哲學的解讀：“這是世界不完美、絕對理性不存在的一個例證。”AI正在拆掉“象牙塔”的高牆外界常有一種刻板印象，認為學術界和業界之間存在著一堵高牆。尤其是在AI這樣節奏極快的領域裡，兩者之間的文化摩擦似乎必然存在。蘇煒傑指出，其實美國高校“象牙塔”的圍牆，並沒有大家想象的那麼高。“學校經費大多來自政府和業界的資助，因此儘管學校層面賦予教授充分的自由，許多教授仍會自發地將科研與業界發展、尤其是AI緊密結合。即便是純數學領域，也有不少學者開始主動擁抱AI，這一點與歐洲學術界形成了鮮明對比。”從賓大沃頓到OpenAI，在他看來，雖然工作模式有所變化，但所追求的東西並沒有根本性不同。“就目前而言，AI的智能呈現出"博遠超人類，精不及專家"的特點。涉獵之廣遠超個人所能，但在專業縱深上尚不及頂尖的知識工作者。而學術界恰恰相反，精益求精有餘，廣博略顯不足，二者構成了極好的互補。”蘇煒傑預計，未來 AI 的持續進化，尤其是專業領域能力的進一步提升，將離不開與學術界的深度協作。這種互補，或許也是理解他這次選擇的另一個角度。“象牙塔”並沒有倒，但它和外部世界之間的通道，正在變得越來越寬。當一位統計學家決定走進風暴眼，他看到的，或許正是那些工程師還沒來得及定義的問題。注：文中所載蘇煒傑觀點僅代表個人立場，不代表 OpenAI 官方立場。本文作者長期追蹤海外AI行業動態，更多深度信息，歡迎添加作者微信IHAVEAPLANB-溝通交流。

原始來源：雷峰網 ↗

查看原始來源

36氪生成式AI

GPT5.6慘遭切腦，Fable 5迴歸要變弱雞版?

這篇消息聚焦「GPT5.6慘遭切腦，Fable 5迴歸要變弱雞版?」。原始導語提到：美國AI，「閉關鎖國」？從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

36氪生成式AI

Anthropic最新報告摸透全球打工人：凌晨5點求睡眠，晚6點問菜譜

這篇消息聚焦「Anthropic最新報告摸透全球打工人：凌晨5點求睡眠，晚6點問菜譜」。原始導語提到：白天，Claude是高薪打工人的生產力引擎；深夜，它成了唯一知道你還醒著的那個。一份報告，意外照出了幾百萬人藏起來的24小時。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

36氪生成式AI

獨家｜獲超億美元融資，Sand.ai 曹越：為什麼視頻是通往世界模型最重要的路徑

這篇消息聚焦「獨家｜獲超億美元融資，Sand.ai 曹越：為什麼視頻是通往世界模型最重要的路徑」。原始導語提到：“每一代模型，我們都在押注一個非共識。” 從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

IT之家生成式AI

北京太空算力創新中心揭牌成立，統籌組織星載 AI 芯片、太空大模型等聯合研發

這篇消息聚焦「北京太空算力創新中心揭牌成立，統籌組織星載 AI 芯片、太空大模型等聯合研發」。原始導語提到：北京太空算力創新中心採用“公司 + 聯盟”雙輪驅動模式，運營主體為北京天算星聯科技有限公司。創新中心承擔四類核心職能。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

智東西生成式AI

讓AI自己修服務器？先過了這場“火線測試”再說

智東西作者 | 陳駿達編輯 | 漠影隨著大模型能力持續提升，智能體正從聊天、寫作等輔助場景走向軟件開發、網絡管理和基礎設施運維等生產環節。尤其在AI基礎設施領域，面對龐大的GPU集群和複雜架構，越來越多企業開始嘗試讓智能體承擔故障排查、告警分析和資源管理等工作，以提升運維效率並降低人力成本。然而，運維場景對智能體構成了空前挑戰。AI算力集群運維橫跨GPU硬件、網絡通信、分佈式存儲、容器編排、訓練框架等多個技術棧，問題現象往往模糊、不完整甚至相互矛盾，智能體需要在開放環境中主動探索、反覆驗證，自行界定問題並尋求解決路徑。要提升智能體在此類複雜場景的綜合能力，一套與之匹配的評測基準不可或缺。但當前行業恰恰缺乏對這種多步推理、開放決策過程的系統化評估能力，導致運維智能體研發長期“無標可依”，進展評估與方向校準均缺乏牽引。正是在這樣的背景下，中國信息通信研究院開源了全球首個面向AI Infra運維場景的智能體評測基準——AISHPerf-智算運維智能體評測基準，國內頭部AI原生基礎設施企業無問芯穹重點參與技術建設。這套基準源自百億條真實運維數據，不再只關注“會不會回答問題”，而是聚焦智能體“能不能解決問題”，為運維智能體能力評估提供了一套貼近真實生產環境的參考標準。一、百億條運維數據，煉出103道“考題” 任何評測體系的價值，最終都建立在數據質量之上。對於運維智能體而言尤其如此。因為真實世界中的故障往往具有高度隨機性和複雜性，許多問題並不存在標準答案，甚至需要跨越多個技術棧進行聯合分析。如果評測數據脫離真實生產環境，即使得到再高的測試分數，也很難證明智能體具備實際應用價值。無問芯穹之所以能夠重點參與這一評測基準的技術建設，與其在AI基礎設施領域的長期實踐密切相關。根據披露的信息，其早在2025年便已將運維智能體應用到實際訓練推理業務中，並取得明顯成效。工單平均處理

1 小時前閱讀分析

智東西生成式AI

OceanBase發佈AI數據庫三件套，TOC最高降50%，螞蟻、靈光都在用

智東西作者 | 王涵編輯 | 雲鵬智東西6月29日報道，今天，OceanBase發佈湖庫一體AI數據庫產品OceanBase Lakebase，該產品面向Agent應用，原生支持多模態數據管理。 “數據湖”是一種集中式存儲架構，可以存儲結構化、半結構化、非結構化等不同類型的數據。Lakebase融合了“數據湖”架構的開放性和“數據庫”架構的功能性，讓結構化數據、非結構化數據和向量數據能夠在統一架構中被管理、加工、檢索和調用。基於此，OceanBase還發布了數據生產、治理和服務工作臺OceanBase DataStudio，以及面向經營分析和業務決策的數據智能Agent OceanBase DataPilot兩個產品。 OceanBase DataStudio覆蓋數據接入、數據加工、任務編排、語義建模、數據治理到Agent協作等環節，幫助企業把分散的數據資產轉化為可管理、可理解、可調用的數據服務。 OceanBase DataPilot作為統一的企業業務智能入口，讓業務人員可以通過自然語言完成分析報告、數據看板和可信答案生成，把過去依賴專業數據團隊完成的分析流程，轉化為可交互、可追問、可複用的智能決策能力。智東西等媒體與OceanBase CEO楊冰、CTO楊傳輝，進行了面對面的交流。楊冰認為，AI正在改變數據的管理方式，數據使用者和數據形態都發生了變化。數據使用者的改變帶來了三大挑戰：VibeCoding帶來了海量Agent應用；Agent開始執行生產任務；Agent長期運行的正確性和自我進化。數據形態改變，則為非結構化數據成為可計算資產、數據要主動流轉、數據要理解任務。兩者作用疊加，OceanBase給出判斷：在AI時代，數據庫應該是湖庫一體的。 OceanBase內部的AI轉型也在進行中。楊冰透露，OceanBase已將內核團隊分為“一體化數據庫”和“A

2 小時前閱讀分析

相關文章

GPT5.6慘遭切腦，Fable 5迴歸要變弱雞版?

Anthropic最新報告摸透全球打工人：凌晨5點求睡眠，晚6點問菜譜

獨家｜獲超億美元融資，Sand.ai 曹越：為什麼視頻是通往世界模型最重要的路徑

北京太空算力創新中心揭牌成立，統籌組織星載 AI 芯片、太空大模型等聯合研發

讓AI自己修服務器？先過了這場“火線測試”再說

OceanBase發佈AI數據庫三件套，TOC最高降50%，螞蟻、靈光都在用