雷峰網生成式AI

從代碼到產線:恩和發佈 BPL 協議語言,定義生物製造的“工業級編譯器”

2026年6月22日 02:25

重點摘要

雷峰網訊。近日,恩和科技在《bioRxiv》發佈Biology Protocol Language(BPL)及其生成管線BPL-COGEN,首次為生物實驗協議建立了一套形式化的語言體系,打通了Physical AI進入物理世界的標準接口。BPL是專為生物實驗協議設計的可編譯、可驗證的形式化語言。BPL-COGEN把自然語言協議自動翻譯為BPL程序,由一個300億參數微調大語言模型與確定性編譯器構成“生成—驗證—修復”閉環。在基於300篇《Nature Protocols》論文的基準測試中,BPL-COGEN實現95.1%的首輪一致性,通過2輪編譯-仿真閉環將正確率推進至98.6%。目前,相關代碼已在GitLab完全開源(MIT License)。AI已會“思考”,但還不會“動手”當前,AI已經能在數字世界生成假設與設計實驗。材料科學領域已經出現自主驅動的Self-driving Lab。但在生物學領域,無論上游AI多麼強大,其輸出最終仍須被翻譯為物理操作,而這一過程,至今仍依賴自然語言文本這是一個半導體和軟件行業幾十年前就已跨越的問題。半導體設計通過Verilog和VHDL完成了從自然語言向硬件描述語言的躍遷,軟件工程通過類型化語言確立了可驗證的穩定性。生物學一直缺少與之對應的、具備編譯器驗證能力的底層語言,這正是當前AI驅動實驗設計與可復現物理執行之間的速率限制環節。代價是清晰的。《Nature》在2016年針對1,576名研究者的調查顯示,超過70%的人無法復現他人實驗,超過一半的人無法復現自己的實驗(Baker, *Nature*, 2016)。恩和團隊的論文進一步將問題歸納為三個維度:協議精確度。典型指令中常隱藏濃度、時間、體積等多處未明分支點。幾十條此類指令疊加,使實驗可復現性完全依賴於人員的經驗補全。協議驗證。自然語言缺乏在執行前模擬物理一致性的機制,內部邏輯錯

站內 AI 整理稿

雷峰網訊。近日,恩和科技在《bioRxiv》發佈Biology Protocol Language(BPL)及其生成管線BPL-COGEN,首次為生物實驗協議建立了一套形式化的語言體系,打通了Physical AI進入物理世界的標準接口。BPL是專為生物實驗協議設計的可編譯、可驗證的形式化語言。BPL-COGEN把自然語言協議自動翻譯為BPL程序,由一個300億參數微調大語言模型與確定性編譯器構成“生成—驗證—修復”閉環。在基於300篇《Nature Protocols》論文的基準測試中,BPL-COGEN實現95.1%的首輪一致性,通過2輪編譯-仿真閉環將正確率推進至98.6%。目前,相關代碼已在GitLab完全開源(MIT License)。AI已會“思考”,但還不會“動手”當前,AI已經能在數字世界生成假設與設計實驗。材料科學領域已經出現自主驅動的Self-driving Lab。但在生物學領域,無論上游AI多麼強大,其輸出最終仍須被翻譯為物理操作,而這一過程,至今仍依賴自然語言文本這是一個半導體和軟件行業幾十年前就已跨越的問題。半導體設計通過Verilog和VHDL完成了從自然語言向硬件描述語言的躍遷,軟件工程通過類型化語言確立了可驗證的穩定性。生物學一直缺少與之對應的、具備編譯器驗證能力的底層語言,這正是當前AI驅動實驗設計與可復現物理執行之間的速率限制環節。代價是清晰的。《Nature》在2016年針對1,576名研究者的調查顯示,超過70%的人無法復現他人實驗,超過一半的人無法復現自己的實驗(Baker, *Nature*, 2016)。恩和團隊的論文進一步將問題歸納為三個維度:協議精確度。典型指令中常隱藏濃度、時間、體積等多處未明分支點。幾十條此類指令疊加,使實驗可復現性完全依賴於人員的經驗補全。協議驗證。自然語言缺乏在執行前模擬物理一致性的機制,內部邏輯錯誤往往只能靠人工判斷甚至“實驗失敗”才能察覺。跨平臺可遷移性。一項跨四個實驗室的合成生物學研究發現,名義一致的協議在不同實驗室間產生了兩倍以上的轉化效率差異(Beal et al., 2016, 2020),根源不在生物本身,而在執行上下文的隱性差別。科學的累積,源於方法可被複現與忠實傳遞。若協議無法被無歧義表達與跨環境複用,AI 生成的實驗設計就無法穩定落地。BPL設計: AI負責生成,BPL-COGEN負責仿真與驗證BPL用形式化規範取代自然語言的歧義。在這套類型系統下,所有隱性參數都必須顯式聲明;任何違反物理規律的操作(如“將固態粉末加入空容器後取上清液”)將在編譯階段直接被攔截,從而避免了錯誤流入真實實驗臺。為配合這一語言體系,團隊構建了BPL-COGEN自動化編譯器。它將一個300億參數微調大語言模型與確定性編譯器耦合在“生成—驗證—修復”的閉環機制中:自然語言SOP被歸一化,轉換為BPL,根據編譯器診斷反覆修正,直到所有物理、量綱、狀態約束全部滿足。LLM負責理解科學家的意圖,編譯器負責驗證物理世界的約束。(b)Bounded agentic workflow: (1) SOP input with optional lab catalog, (2) BPL-Nano-30B code generation, (3) three-gate compiler validation (parse, semantic, and plan/validate gates), (4) diagnostic-guided repair loop (max 3 attempts), and (5) output artifact generation. (c) BPL compiler architecture: six-layer compilation pipeline.實驗驗證:多維度證實三大難題的解決團隊從三個層面對BPL-COGEN進行系統性驗證。大規模文本評測。在300篇Nature Protocols論文上,BPL-COGEN實現95.1%的首輪一致性。經2輪編譯-仿真閉環達98.6%的迭代正確率。(a) LLM validation scores across processed variants. Overall score, experiment match, protocol validity, and phase completeness all remained high (mean: 95.1). This panel establishes that BPL outputs are not only structurally regularized, but also remain faithful to the underlying experiment.(b) Compilation success rate by attempt number: 82.3% of protocols compile on the first attempt; the repair loop resolves an additional 16.3%, leaving only 1.4% unresolved after three attempts 分子生物學驗證。同一份BPL源碼同時編譯至手動操作與自動化設備兩種執行上下文,均產生可復現的實驗結果。證明了協議在執行模態上的可遷移性。GFP fluorescence measurement of cell cultures with IPTG induction. Medium: negative control without cells.分析化學遷移驗證。在不同設備上下文之間遷移後,類胡蘿蔔素的表徵獲得了可比的分析結果,驗證了協議的設備無關可遷移性。(b) HPLC chromatogram (C18, 4.6 × 250 mm, 5 μm; 32 min). (c) UHPLC chromatogram (Kinetex C18, 2.1 × 50 mm, 1.7 μm; 2.1 min). All five compounds (retinol, retinal, retinyl acetate, lycopene, β-carotene) achieved baseline resolution with preserved elution order.這三項驗證共同確認:BPL與BPL-COGEN同時解決了長期困擾行業的協議精確度、可驗證性、跨平臺可遷移性三大核心難題。在SAION物理AI平臺中的定位BPL是恩和SAION物理AI平臺“認知—控制—執行”三層架構中執行層的標準接口。向下,它下發指令到生物鑄造廠的自動化設備與人類操作員;向上,它迴流結構化的實驗執行數據,驅動認知層與控制層的持續進化。結合此前SAION AI平臺在文獻閱讀到質粒設計與溼實驗組裝的100%正確率、質粒構建90%成功率,BPL的引入使物理AI閉環的執行層首次具備了可驗證、可遷移的標準協議基礎。在AI+生物製造全球圖景中的意義生物製造領域AI技術的核心價值,在於能否真實推動兌現數千萬元乃至數億元的經濟效益。當AI真正驅動產業鏈、產品、訂單的經濟價值兌現時,它在產業中才獲得存在的意義。BPL的提出,是恩和把“AI 兌現產業價值”落到執行層的具體動作。據相關機構預測,至2035年全球生物製造市場規模將達到約6萬億美元。縱觀工業史,所有制造業從“作坊”走向“工業化”的關鍵點,都伴隨著形式化協議標準的建立。作為首個具備“編譯時物理驗證 + 跨平臺可遷移”雙能力的工程級方案,BPL為這一萬億級賽道的標準化推進提供了關鍵基礎設施。正如研究團隊在論文中所指出的:BPL-COGEN提供了生物領域物理具身AI所需的關鍵基礎。只有當AI能夠以一種可被驗證的語言“說清楚自己想做什麼”,自主實驗室代理才在工程上成為可能。生物製造的工程邊界,正被重新定義。論文原文:Song, R., Fu, Y., Zhao, Z., Yu, J., Yuan, Q., & Chen, C. T. (2026). Towards autonomous biology: Compiler-Verified Protocols as a Foundation for Real World AI Execution. bioRxiv, 2026-05.恩和科技(Bota)是一家全球領先的物理人工智能(Physical AI)驅動的生物製造公司,致力於將生物技術打造為可靠、可規模化的工業生產力引擎。通過整合人工智能、合成生物學與工業化的端到端能力,Bota開啟了生物製造研發與生產的新範式。我們打造了全球首屈一指的物理智能驅動的生物鑄造廠,涵蓋了從菌株工程、工藝開發到規模化生產的全過程——將複雜的生物學轉化為適用於食品、營養、個人護理及更多行業的可規模化解決方案。Bota與全球客戶攜手,提供更綠色、更高效的生物解決方案,加速行業普及,並共同推動向可持續未來的轉型。瞭解更多信息,請訪問:www.bota.bio 雷峰網文章

Related

相關文章

雷峰網生成式AI

LiblibAI 母公司完成近 3 億美元融資:AI 應用層開始進入「收入說話」的階段

演語科技,正在成為這一輪變化中最值得觀察的中國樣本之一。 作者丨鄭佳美 編輯丨馬曉寧 AI 應用公司的競爭,正在發生變化。過去兩年,行業最關心的是誰能率先做出令人眼前一亮的產品,誰能更快抓住大模型帶來的流量紅利。但到了 2026 年,問題開始變得更現實:用戶會不會持續使用?客戶願不願意付費?一家公司能不能從單個產品,長成一個真正有收入、有生態、有複利的業務體系?演語科技(Evoken)最近完成的這輪融資,正好提供了一個觀察窗口。近日,演語科技正式對外披露近 3 億美元 B+ 輪融資。該輪融資實際已於今年上半年早些時候完成,投後估值超過 20 億美元。本輪融資由 Granite Asia、騰訊、順為資本聯合領投,HT Investment、時代資本共同參與投資。高榕資本、螞蟻集團、渶策資本、明勢創投、源碼資本、紅杉中國以及其他數家知名投資機構等現有股東持續加碼支持。這也是目前國內 AI 應用層金額最大的單輪融資之一。但相比融資金額本身,更值得注意的是,這家公司已經不再只是講一個“AI 產品”的故事。演語科技正在把 LiblibAI、LibTV、星流等業務整合到同一個更大的敘事裡:圍繞 AI 創意內容生產,構建一個從社區、素材、視頻到設計 Agent 的應用矩陣。這也是演語科技首次以集團品牌 Evoken 統一對外發聲的重要背景。01AI 應用層到了拼商業化的時候過去一段時間,AI 行業的焦點大多集中在模型公司身上。誰的模型能力更強,誰的生成效果更好,誰能把成本降下來,往往決定了外界對一家公司的想象空間。但應用層的邏輯並不完全一樣。應用公司最終要回答的問題,不只是“能不能生成”,而是“生成之後是否真的進入了生產流程”。一個 AI 產品如果只是被用戶嚐鮮,它很難形成長期價值。但如果它進入設計師、短劇團隊、廣告公司、品牌方和影視製作機構的日常工作流,就意味著 AI 不再只是工具,而

3 小時前
雷峰網生成式AI

Claude Code 修了幾個小 bug,卻揭開了 Agent 落地的大麻煩

工具狀態、權限邊界和後臺任務,正在成為 AI 編程產品的新考驗。 作者丨鄭佳美 編輯丨馬曉寧 剛剛,Anthropic 給 Claude Code 發了一次看起來並不起眼的更新。沒有新模型,沒有新的 benchmark,也沒有代碼能力提升多少的宣傳。Claude Code 2.1.179 的 changelog 裡,主要是一些細碎的 bug fix:連接中斷後保留 partial response,工具執行的 spinner 不再卡住,Linux sandbox 裡的 denyRead / allowRead glob 不再把 Bash tool description 撐到巨大,遠程 session 裡的後臺任務也不會在多個 turn 之間一直顯示 still running。如果只看字面,這些都像是產品使用過程中的小毛病。但放在 AI 編程產品的演進裡,它們其實指向同一個變化:Claude Code 這樣一類 coding agent,已經不只是“幫你寫代碼的聊天框”,而是在變成一個真正替你執行任務的系統。雷峰網過去我們討論 AI 編程產品,最常看的還是模型能力。誰的代碼生成更強,誰能理解更長的上下文,誰在 SWE-bench 上拿到更高分,誰能一次性給出更完整的修復方案。這些當然重要,但它們主要回答的是一個問題:模型夠不夠聰明。而 Claude Code 這次修的幾個問題,回答的是另一個問題:當模型真的開始替用戶幹活,外層系統能不能穩定地把這件事做完。雷峰網01Bug 之外 ,是 Agent 落地的執行問題傳統聊天機器人主要是在“回答”。用戶問一句,它回一句。即使回答中途斷了,或者內容不夠完整,通常也只是重新生成一次。但 coding agent 面對的是另一種任務。用戶不是問“這段代碼是什麼意思”,而是讓它“幫我修這個 bug”“跑一下測試”“把這個模塊重構掉”“看

3 小時前
雷峰網生成式AI

AI 太燒錢!微軟選擇「倒戈」DeepSeek

Claude、GPT 不再獨佔 Copilot。 作者丨樊天驕、鄭佳美 編輯丨鄭佳美 這兩天,微軟連續釋放了兩條重磅消息。第一條來自產品層面。微軟宣佈 Copilot Cowork 在全球正式上線。這款能夠跨 Outlook、Teams、Excel 等應用自主執行任務的 AI Agent 系統將正式商用。據微軟披露,超過一半的《財富》500 強企業已經在預覽期進行了部署。第二條則來自商業模式層面。Copilot Cowork 將不再完全沿用每月 30 美元的固定訂閱模式,而是開始引入按使用量計費機制。幾乎在同一時間,Axios 又披露了一則消息:微軟正評估將 DeepSeek V4 引入 Copilot Cowork,作為低成本模型選項。如果最終落地,這將成為美國大型科技公司首次在核心企業級 AI 產品中引入中國大模型。這兩條消息似乎釋放出一個信號,即Agent 的普及正在讓 AI 的成本問題變得前所未有地突出。過去的聊天機器人更像一次性服務。用戶提問,模型回答,任務到此結束。而在 Agent 模式下,一個任務往往需要經歷任務拆解、數據檢索、工具調用、結果生成和反覆修正等多個環節。用戶看到的是一次任務交付,系統背後卻可能已經完成了數十次甚至上百次模型調用。當下的模型市場價格體系也在迅速拉開差距。從 Anthropic 高端模型每百萬 Token 數十美元的推理成本,到 DeepSeek V4 Flash 每百萬 Token 不足 0.3 美元,價格跨度已經達到數百倍。當任務量持續增長、模型價格不斷分化,企業需要解決的問題便不再是“選擇哪個模型”,而是“什麼任務應該使用什麼模型”。模型路由、成本控制和資源調度,也因此開始從後臺基礎設施問題,走向 AI 產品競爭的核心位置。01算力成本為何激增要理解微軟此次架構重構的必要性,首先需要看到一個正在發生的變化:Agent 正在改變

4 小時前