盤點YC最新24個創業公司,發現了AI的下一個方向
重點摘要
AI應用風向標(公眾號:ZhidxcomAI) 編譯|畢偉豪 編輯|漠影 智東西6月5日報道,過去二十年,作為世界著名的創業公司孵化器,Y Combinator(後簡稱YC)中孕育了太多影響整個行業的創企,包括Airbnb、Stripe、Coinbase和Instacart等等。 但比產出獨角獸更值得關注的,是它作為行業風向標在講述一件事:硅谷最聰明的一批人正在把錢和時間砸向哪裡。 縱觀今年YC這一批初創公司的名單,一個趨勢呼之欲出:AI的上一個階段是造更聰明的模型,而下一個階段,是讓智能體能在真實商業環境裡落地。 當AI Agent從Demo走進生產環境,面臨的是一連串新問題:Agent需要記憶、身份、合規、監控、驗證、企業系統接入,還需要能支撐規模化運行的算力、網絡和能源基礎設施。 這一批YC公司,盯上的正是這些,越來越聰明的模型已經不夠了,可靠性、信任度、基礎設施和實際部署這些問題,是Agent商業化落地的新挑戰和新機遇。 一、成本、可靠性和記憶,讓Agent真正走進企業 創業公司ReasonBlocks解決的就是成本與可靠性,這是企業引入Agent最頭疼的問題。它的思路不是造新模型,是讓現有模型更實用,平臺把Agent以前運行中成功的推理模式存下來,注入到後續工作流裡,幫Agent避開重複錯誤,同時大幅降低Token消耗。 ReasonBlocks報告稱,在SWE-Bench Pro(該公司研發的智能體平臺)上,同樣的底層模型,Token用量降了52%,準確率提了42%。 CEO Sajeev Magesh說了一句很實在的話:“生產環境裡的AI Agent又貴又不可靠,公司每個月花費高達六位數美元,而這些系統仍然頻繁失效,難以信任。” 如果說ReasonBlocks想做的是“讓Agent便宜還不犯錯”,那Memory Store面向的就是另一個更底層的問題:讓Age
AI應用風向標(公眾號:ZhidxcomAI) 編譯|畢偉豪 編輯|漠影 智東西6月5日報道,過去二十年,作為世界著名的創業公司孵化器,Y Combinator(後簡稱YC)中孕育了太多影響整個行業的創企,包括Airbnb、Stripe、Coinbase和Instacart等等。 但比產出獨角獸更值得關注的,是它作為行業風向標在講述一件事:硅谷最聰明的一批人正在把錢和時間砸向哪裡。 縱觀今年YC這一批初創公司的名單,一個趨勢呼之欲出:AI的上一個階段是造更聰明的模型,而下一個階段,是讓智能體能在真實商業環境裡落地。 當AI Agent從Demo走進生產環境,面臨的是一連串新問題:Agent需要記憶、身份、合規、監控、驗證、企業系統接入,還需要能支撐規模化運行的算力、網絡和能源基礎設施。 這一批YC公司,盯上的正是這些,越來越聰明的模型已經不夠了,可靠性、信任度、基礎設施和實際部署這些問題,是Agent商業化落地的新挑戰和新機遇。 一、成本、可靠性和記憶,讓Agent真正走進企業 創業公司ReasonBlocks解決的就是成本與可靠性,這是企業引入Agent最頭疼的問題。它的思路不是造新模型,是讓現有模型更實用,平臺把Agent以前運行中成功的推理模式存下來,注入到後續工作流裡,幫Agent避開重複錯誤,同時大幅降低Token消耗。 ReasonBlocks報告稱,在SWE-Bench Pro(該公司研發的智能體平臺)上,同樣的底層模型,Token用量降了52%,準確率提了42%。 CEO Sajeev Magesh說了一句很實在的話:“生產環境裡的AI Agent又貴又不可靠,公司每個月花費高達六位數美元,而這些系統仍然頻繁失效,難以信任。” 如果說ReasonBlocks想做的是“讓Agent便宜還不犯錯”,那Memory Store面向的就是另一個更底層的問題:讓Agent記憶更穩定。 創始人Ishita Jindal和Diwank Singh在2018年因為對電影《她》的共同痴迷認識,後來通過開源平臺Julep做了幾千個Agent,發現這些Agent會反覆忘記上下文、重複犯同樣的錯。於是出來做了Memory Store,讓人類和AI Agent共享一個記憶層。 Jindal的判斷是:“未來區分公司的不再是執行力,是它知道什麼別人不知道的東西。” AgentPhone這家公司很有意思,他們想給每個Agent配一張身份證。創始人Meet Modi直言:“每個人都有一個電話號碼。這是世界識別你、聯繫你、信任你的方式。AI Agent還沒有這個。” Runtime則是專注於企業基礎設施部署,他們所做的事情是整個AI Agent行業最不光鮮靚麗的環節:讓Agent真正走進企業內部。創始人認為,下一代AI的贏家,是那些讓模型能以足夠可靠的姿態進入真實生產環境的企業。 Agent上線前還有最後一道關:安全驗證Arga Labs做的正是驗證層工作。它建了一套數字孿生環境,企業在上生產環境之前可以在裡面安全地測試AI Agent。 創始人Phillip Li說了一句反直覺的判斷:“大多數人認為AI越聰明,需要的測試越少。我們正好相反,Agent能力越強,它犯錯的代價就越大。” Agent跑起來了,下一個問題是它出了事怎麼辦。Sazabi在做AI原生的可觀測性平臺,自動化事件檢測、根因分析和響應,負責企業代碼安全維護以及報錯提醒等方面。 創始人Sherwood Callaway是兩屆YC老人、a16z scout,之前在Brex建了多年基礎設施。他的觀點是“監控已死,未來是Agent驅動的自動警告。” 有意思的是,Sazabi的融資方式也不走尋常路,沒靠少數機構投資人,而是集結了100多個天使投資人,包括Browserbase、LangChain、Graphite、Daytona這些公司的創始人和工程負責人,相當於把AI開發者工具圈最核心的一批人全拉上了船。 二、不是做軟件,要做AI打工人 基礎設施搭好之後,更激進的問題來了:Agent到底能不能替代人類?有幾家公司把邊界推得更遠,要直接替代一整類崗位,而不是給現有崗位提效。 Dayjob的故事最能說明這種思路的轉變,創始人花了18個月給垃圾處理公司做軟件,結果發現客戶真正要的根本不是軟件,每天早上,運輸調度員花幾個小時手動排路線,排完後路況一變全白乾。 創始人George Postlethwaite說他們終於醒悟了:“我們停止做軟件,開始做AI工人。”現在Dayjob的Agent可以在幾分鐘內重建複雜的物流排班。 這種思路正在從物流蔓延到營銷,Revnu的創始人George Jefferson在大學宿舍裡用AI自動跑增長實驗,從軟件開發到客服全自動化,最後發現增長和營銷這塊效果最好。 他說:“AI已經自動化了軟件工程,下一步是自動化增長。”現在Revnu在做能自己跑增長實驗、衡量結果、優化投放的系統。 如果說Dayjob和Revnu是在替代具體崗位,那Modern的目標就是替代一整個企業服務平臺。它對標的是ServiceNow,但思路完全反了過來,直接從底層就圍繞Agent重新搭建。 創始人Seb Poole的判斷是:“企業軟件一直是追蹤系統,真正幹活的是人。”Modern的Agent設計目標是自主解決服務檯工單,在可審計的確定性工作流內運行。 三、走進物理世界:B超、機器人、空中交通管制 從軟件世界往外跨一步,這批裡還有幾家公司在追求讓AI走進物理世界。 Lumius做的是“人體的3D相機”,把AI、計算和醫學影像結合,讓B超更容易解讀和使用,從臨床診斷到手術機器人,應用場景跨越很大。 Avea Robotics解決的是機器人落地中最無聊但最貴的問題:機器人遇到故障時讓人立刻遠程介入,減少停機時間。這個問題在工廠和倉庫的流水線裡非常重要,因為哪怕很小的故障率都要付出巨大的成本。 General Aviation直接上天了,他們用Starlink低軌衛星將飛機直接連上互聯網,建了一套新的空中交通管制系統。這個想法幾十年前就有,但有了Starlink之後才真正開始可行。 四、AI進企業的最後一公里:傳統桌面軟件的Agent接入 物理世界難,但有時候企業軟件更難。Forbes提到了這樣一個數據,70%以上的財富500強公司還依賴於沒有現代API的傳統桌面應用。 這種應用在接入AI的過程中非常困難,替換成本高、風險大、很多時候根本不現實。AI再聰明,解決不掉這些老系統就進不了大部分企業的核心流程。 Minicor盯上的就是這個缺口。它讓AI Agent通過智能桌面自動化直接與這些老系統交互。用確定性代碼加Agent工作流,在不替換現有基礎設施的前提下創建、監控和修復自動化流程,無需企業替換系統,YC期間它的月經常性收入翻了三倍。 Minicor的收入增長說明了一個巨大的機會:最大的AI機會不是替換舊系統,是讓舊系統能被AI使用,這個邏輯在這批創業公司中反覆出現。 五、合規、保險、經紀人,讓企業願意信任Agent 系統打通之後,信任問題就浮出水面了。一旦出現錯誤,誰來負責?這批次裡有幾家公司正在回答這個問題。 Complir把AI帶進了合規領域,CEO Gustav Bang說:“合規,這詞無聊到讓人犯困,但它是這十年最重要的基礎設施之一。”合規行業目前還嚴重依賴PDF、電子表格和人工審查,而這些正是Agent所擅長的。 如果說合規是事前預防,那保險就是事後兜底。Klaimee在做專門給AI Agent的保險,目前傳統保險產品保護的是人和計算機系統,不包括能自己做決定的自主軟件。創始人認為Agent的崛起會創造全新的風險類別,需要全新的保險品類。 有了保險產品,還需要有人幫企業選,Kinro就在做AI原生的保險經紀人,核心業務是幫小企業選擇保險方案、進入市場和持續管理保單。 六、算力、能源、冷卻:AI背後看不見的基建 往上走了這麼久,得回到最底層看一眼。所有Agent、所有模型、所有企業應用,最後都要落到服務器上。而有些YC創業公司發現,服務器層面欠的債可能比軟件層面更大。 Expanse發現了數據中心的巨量閒置算力。CEO Ismaeel Bashir說:“全球一半算力正在被浪費。”他們在單個數據中心裡發現了幾百萬美元的閒置容量,於是做了一個平臺來識別和重新分配這些資源。 就算把所有閒置算力都用上,現有的計算架構可能還是不夠。ProjectX的判斷更底層:現代操作系統從來不是為人類和AI Agent同時工作的場景設計的,需要全新的計算架構。 如果說算力是上限,能源就是地基。Apollo Atomics在做緊湊型核反應堆的商業化。創始人Assil Halimi在核工業幹了十多年,他認為:“這個行業最大的障礙不是物理,而是工程落地。”YC期間,Apollo從單一商業協議擴展到了超過20GW的合作意向和夥伴關係。 與此同時,Madrone正在解決散熱問題,創始人估計一個數據中心約有30%電力消耗在散熱上,YC期間Madrone把散熱產能提升了100倍,正在加速量產。 七、金融、招聘和開發者內容,AI進入垂直行業核心圈層 基礎設施講完了,最後一個視角是垂直行業,一批公司正在把AI引入具體賽道,其中幾個切入角度很有意思。 MochaTrade讓印度交易員能接入美國金融市場的永續合約。創始人Utkarsh Sinha說:“我們做MochaTrade是因為受夠了被當作想交易的市場裡的二等參與者。”這話背後是一個被忽視的全球市場缺口。 KelAI的切入點完全不同,它是把AI引入投資研究這個高度依賴人力的環節。創始人Jeremie Cohen在WorldQuant做了六年,想研究持續自我進化的智能投資分析系統,加速投資想法從產生到驗證的過程。 從投資到招聘,這個跨度看起來很大,但Asendia AI遇到的行業問題和前面公司本質上是一樣的:大量重複性勞動困住了理應做判斷的人。 創始人Rihab Lajmi說了一句很有個性的話:“我們不是招聘行業出來的,我們是被一個爛透了的流程氣進來的。”進YC前,他們花了幾個月跟著招聘人員和獵頭公司實地觀察,看到的是被電子表格、人工外呼和重複行政工作困住的行業。 除了這些傳統行業,Manicule也值得一提,兩個創始人只有18歲,做的事是幫以開發者為核心創業公司建立信譽並觸達技術受眾,在AI內容氾濫的時代,這對18歲的創始人賭的是高質量技術內容和開發者教育會越來越值錢。 結語:YC新一批的創業公司,關注的是未來的一切 過去幾年AI競賽的定義是更強的模型、更好的基準測試、更強的系統,而這批YC創業公司所關注的方向表明,下一個挑戰不是創造智能,是落地。 Agent要進入真實商業場景,需要一套全新的基礎設施層。與此同時,物流、招聘、醫療、金融、航空、製造業這些變化速度本來很慢的行業,也正在被AI從不同的角度滲透。 這些公司能不能成功沒人知道,但他們走的路,或許就是Agent未來的方向。 來源:Forbes
Related
相關文章
Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages
This week, Liquid AI released two new retrieval models. They are LFM2.5-ColBERT-350M and LFM2.5-Embedding-350M. Both hold 350M parameters. Both are the first bidirectional members of the LFM family. They build on LFM2.5-350M-Base, released in March. The pair targets fast multilingual and cross-lingual search across 11 languages. Their footprint is small enough to run almost anywhere. Both are available now on Hugging Face under the LFM Open License v1.0. LFM2.5 Retrievers The two models share one backbone but represent text differently. LFM2.5-Embedding-350M is a dense bi-encoder. It turns each document into a single vector. Pick it when you want the fastest search and the smallest, cheapest index. LFM2.5-ColBERT-350M is a late-interaction model. It converts each token into a vector rather
Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight
Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

智譜新高,MiniMax承壓,“大模型雙雄”命運殊途
這篇消息聚焦「智譜新高,MiniMax承壓,“大模型雙雄”命運殊途」。原始導語提到:大模型在被市場重新定價 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

華為昇騰 0 Day 支持智譜 GLM-5.2 模型,提供全面推理優化
華為昇騰 AI 宣佈在智譜開源 GLM-5.2 大模型當天即完成深度推理優化。通過 MOE 大融合算子、通信計算融合、高併發調度等七項關鍵技術,顯著提升編程和長程任務的處理效率,現已支持 A3 系列產品部署。#AI 大模型# #國產算力#
企業AI轉型再添利器:青雲科技算力雲接入 MiniMax-M3 模型
企業AI落地面臨高效低成本難題。青雲科技旗下基石智算平臺接入國產開源大模型MiniMax-M3,提供新算力支持。MiniMax-M3以卓越上下文處理能力等三大核心技術見長,依託自研架構,助企業便捷部署AI業務。
阿里開源統一科學大模型 LOGOS,僅用五十六分之一參數超越微軟
阿里 ATH-Token Foundry 聯閤中國人民大學高瓴人工智能學院開源科學基礎模型 LOGOS。該模型採用統一科學語法與純序列建模範式,在六大科學任務上匹配或超越傳統專用方法。其中 LOGOS-1B 僅 1B 參數,即展現出極高效率,性能超越參數量達 8×7B 的微軟模型。