MarkTechPost AI生成式AI

OpenAI 預覽 GPT-5.6 系列:Sol、Terra、Luna 三款分級模型,新增推理模式與有限存取

2026年6月26日 19:18

重點摘要

OpenAI 已開始有限預覽其下一代模型系列 GPT-5.6。該系列分為三個命名等級:Sol、Terra 和 Luna。Sol 為旗艦款,Terra 專注於日常生產工作,Luna 則是快速且低成本的選擇。OpenAI 最初透過 API 和 Codex 向一小部分信任的合作夥伴開放。根據 OpenAI 的貼文,他們已率先與美國政府分享了這些模型和計劃。未來幾週內,ChatGPT、Codex 和 API 將進一步擴大存取權限。這次變更主要是結構性的:GPT-5.6 引入了分級模型、兩種新的推理模式,以及更嚴格的安全防護層。什麼是 GPT-5.6?它是一個模型家族,而非單一模型。OpenAI 也更改了版本命名方式,數字現在代表世代,名稱則標示穩定的能力等級。

站內 AI 整理稿

OpenAI has begun a limited preview of GPT-5.6, its next-generation model series. The lineup splits into three named tiers: Sol, Terra, and Luna. Sol is the flagship. Terra targets everyday production work. Luna is the fast, low-cost option. OpenAI is starting with a small group of trusted partners through the API and Codex. According to OpenAI post, they shared the models and plans with the U.S. government first. Broader access in ChatGPT, Codex, and the API is planned in the coming weeks. The change is mostly structural. GPT-5.6 introduces tiered models, two new reasoning modes, and a heavier safety stack. What is GPT-5.6? GPT-5.6 is a family, not a single model. OpenAI also changed how it names releases. The number now marks the generation. The names mark durable capability tiers. Each tier can advance on its own schedule. That gives developers a clearer choice across intelligence, speed, and cost. OpenAI calls Sol its strongest model yet. It cites gains in coding, biology, and cybersecurity. Terra matches GPT-5.5 performance while costing roughly half as much. Luna brings strong capability at OpenAI’s lowest price. New Reasoning Modes: max and ultra GPT-5.6 adds two reasoning controls. The first is a new max reasoning effort. It gives Sol the most time to reason deeply. The second is ultra mode. Instead of one model working alone, ultra leverages subagents. These subagents split complex work to accelerate it. Think of it this way. The max setting deepens a single chain of reasoning. The ultra mode coordinates several workers on one task. Both trade latency and cost for accuracy on long-horizon problems. Interactive Explainer (function(){ function onMsg(e){ var d=e.data; if(d && d.type==='mtp-embed-height' && d.id==='gpt56'){ var f=document.getElementById('mtp-gpt56-frame'); if(f && d.height){ f.style.height=d.height+'px'; } } } window.addEventListener('message',onMsg,false); })(); Benchmark OpenAI shared a preview set of evaluations. Sol sets a new state of the art on Terminal-Bench 2.1. The benchmark tests command-line workflows that need planning, iteration, and tool coordination. Model / modeTerminal-Bench 2.1GPT-5.6 Sol (ultra)91.91%GPT-5.6 Sol (max)88.76%Claude Mythos 588%GPT-5.583.4%source: venturebeat On Agent’s Last Exam, Sol was the only model past the halfway mark. It reached 50.9% in ‘code mode,’. On GeneBench v1, Sol beat GPT-5.5 on long-horizon genomics analysis. It did so while using fewer tokens. On ExploitBench, OpenAI reports Sol was competitive with Mythos Preview using about one-third of the output tokens. Pricing and Access GPT-5.6 is priced per one million tokens. Caching behavior also changes. ModelInput / 1MOutput / 1MBest forSol$5$30Long-horizon coding, security, agentsTerra$2.50$15High-volume production workLuna$1$6Fast, routine, low-cost tasks Sol’s $5/$30 matches GPT-5.5’s pricing. Terra is about 2x cheaper than GPT-5.5. Prompt caching now supports explicit cache breakpoints and a 30-minute minimum cache life. Cache writes cost 1.25x the uncached input rate. Cache reads keep the 90% discount. OpenAI also plans to run Sol on Cerebras hardware. It targets up to 750 tokens per second in July. Use Cases With Examples Long-horizon coding agents: Sol’s Terminal-Bench gains suit multi-step CLI automation. Example: an agent that plans, edits files, runs tests, then iterates. High-volume production: Terra fits chat features and document processing at scale. Example: summarizing thousands of support tickets each day at lower cost. Latency-sensitive apps: Luna suits autocomplete, routing, and simple extraction. Example: classifying inbound emails before a heavier model handles edge cases. Defensive security work: Sol targets vulnerability research and patching. Example: reviewing a codebase to find and fix a memory bug. Strengths and Open Questions Strengths Clear tiering across cost, speed, and intelligence New ultra subagent mode for complex, parallel work Reported state-of-the-art on Terminal-Bench 2.1 Token-efficiency gains on biology and cyber benchmarks A documented, layered safety stack Open questions Access is limited to about 20 partners at preview Public benchmark detail is partial until general availability Safeguards may block some legitimate dual-use security work Pricing sits above some open-weight competitors like GLM-5.2 Real-world latency for max and ultra is not yet public Check out the Technical details. Also, feel free to follow us on Twitter and don’t forget to join our 150k+ML SubReddit and Subscribe to our Newsletter. Wait! are you on telegram? now you can join us on telegram as well. Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us The post OpenAI Previews GPT-5.6 With Sol, Terra, and Luna: Tiered Models, New Reasoning Modes, Limited Access appeared first on MarkTechPost.

Related

相關文章

鈦媒體生成式AI

GPT設計GPT

這篇消息聚焦「GPT設計GPT」。原始導語提到:如果說英偉達賣鏟子,那麼OpenAI想擁有礦山。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

11 小時前
智東西生成式AI

剛剛,全球第一個能同時掃微信和支付寶的AI眼鏡,誕生了

智東西 作者 | 雲鵬 編輯 | 心緣 智東西6月26日杭州現場報道,剛剛,XR領域頭部創企樂奇Rokid在生態開發者大會上正式發佈了新一代Rokid AR眼鏡,其重點提升了顯示效果。 此外,智能眼鏡操作系統YodaOS升級為AIOS,融入更多智能體能力,主動服務能力更強。 Rokid AR搭載了高通驍龍至尊版空間計算協處理器,支持空間+AI雙攝、6DoF立體空間、電致變色和58°FoV視野,可以說是規格拉滿。 Rokid創始人兼CEO祝銘明在採訪中特別提到,這顆芯片比高通近日發佈的驍龍Reality Elite芯片性能更強,提升幅度在20%左右。 不過這款AR眼鏡新品並未公佈具體售價和上架時間。 祝銘明在大會上做了一個重磅“預告”,Rokid AI眼鏡和Rokid AR眼鏡合二為一的AI+AR“完全體”產品,大概會在3-5年內落地。 AI眼鏡軟件生態層面,Rokid全球首發了微信掃一掃支付,其AI眼鏡也成為首個同時支持微信和支付寶的同類產品。 Rokid AI眼鏡上的YodaOS升級為“AIOS”,樂奇AI助手正式升級到2.0版本,主動智能、智能化UI交互呈現是其兩個核心能力升級點。 比如閱讀智能體,可以直接朗讀攝像頭識別到的信息; 作業輔導智能體,可以通過視覺識別輔導孩子作業; AI打車助手可以讓你直接用眼鏡打車,並且屏幕上實時追蹤車輛進度; 在臨近旅行、出差出發時AI助手會主動提醒,告知當地天氣與準備事項; AI助手可以用餅狀圖告訴你面前食品的卡路里,還能用可視化表格呈現世界盃賽事比分。 在Rokid看來,AIOS時代,AI會“繞過”App,變為自帶能力的原生服務主體,AI眼鏡使用AI有輕量化、多模態、全天候的特點。 值得一提的是,在AI付費模式方面,祝銘明在採訪中特別提到,未來Rokid可能會推出“Token收費模式”,今年用戶在Rokid平臺的AI消耗Token量

13 小時前
雷峰網生成式AI

全網瘋搶體脂秤背後,阿福找到了健康AI的正確打開方式

“一代人有一代人的雞蛋要領”,這次輪到了體脂秤。6月25日,螞蟻阿福發起的“科學減重1億斤”健康行動正式上線,同時向全網發放“骨折價體脂秤”。除了9.9元快遞費,網友只需1分錢就能領到手,參與科學減重。社交平臺上,曬單和討論同步發酵,搶到的人曬出訂單截圖,紛紛表示“已下單”“等發貨”“真香”;沒搶到的在評論區急得團團轉,追問領取方式,反覆確認阿福真的給出了“地板價”。據螞蟻阿福旗艦店數據顯示,這款AI體脂秤上線24小時,領取量已經超過30萬臺。雷峰網記者在阿福APP實測發現,為了讓體脂秤送到真正需要的用戶手中,在阿福App下單需先支付30.01元,收到秤後綁定並完成AI解讀,就可獲得30元返現,相當於體脂秤到手只要1分錢。一臺體脂秤為何引發“全網瘋搶”熱潮?背後折射的,恰恰是普通人長期被健康管理困住的真實焦慮。1分錢領體脂秤,阿福把體重管理的門檻打下來體重管理的第一步,是瞭解自己的身體狀況。但現實是,很多人只知道體重,卻不瞭解體脂率、肌肉量、骨密度等基礎的體重管理概念。大多數時候只能憑感覺,毫無依據地開始節食或是突擊運動,沒過幾天又“放棄抵抗”,循環往復。阿福的第一步,就是把體重管理的基礎工具——體脂秤的門檻打下來。此次阿福提供的“骨折價”AI體脂秤,支持測量體重、BMI、體脂率、內臟脂肪、肌肉量等18項身體數據。用戶在阿福APP綁定體脂秤後,在阿福首頁“我的健康”以及阿福“健康檔案”,就可隨時查看健康數據,並清楚顯示指標屬於標準還是偏低、偏高。這些數據維度合在一起,讓用戶對身體狀況的瞭解能夠更加全面,進而體重管理更加科學。此外,阿福也支持接入手機、運動手錶和血氧儀等多種類健康硬件。用戶已有的體脂秤、手環、血糖儀、運動手錶,數據都可以同步到阿福APP。AI不再憑一個體重數字猜測身體,可以進一步基於多維數據給出貼合現狀的分析和方案;用戶也減少了在多個硬件APP和AI對話框來回

13 小時前
雷峰網生成式AI

RoboScience機器科學發佈通用具身大模型Visics,首次完整展示VLOA雙引擎架構

雷峰網獲悉,6月24日,通用具身智能企業RoboScience機器科學在深圳成功舉辦通用具身大模型發佈會。會上,公司首次完整披露了自研Visics大模型的技術架構VLOA(Vision-Language-Object-Action),並展示了模型在多項真實場景的應用,包括全球最複雜具身操作任務傢俱拼裝。 RoboScience機器科學創始人兼CEO田野、聯合創始人兼執行總裁汪濤深度解讀了Visics大模型、底層技術架構VLOA和數據體系,並分享了未來在模型泛化、場景落地及生態構建等方面的戰略規劃。Visics大模型重新定義具身智能RoboScience機器科學創始人兼CEO田野告訴雷峰網,當前機器人操作面臨泛化能力差、精細操作難、長程任務誤差累積三大核心瓶頸。Visics大模型的突破在於首次通過自研技術架構VLOA,將Object Trajectory(物體3D點雲軌跡)作為中間接口,把“認知”與“執行”徹底解耦。他表示:“Object 這個詞本身有‘物體’和‘目標’兩種意思,所以它精確地描述了機器人本體跟物體要發生什麼樣的交互、要完成什麼樣的物體運動狀態的變化。我們自研以Object Trajectory為中心的 VLOA 架構,是因為它往上能夠精確地表示我們執行任務的內容,往下能夠精確地表示機器人要完成什麼目的。”VLOA(Vision-Language-Object-Action)創新架構實現了三大維度泛化:指導任意機器人、操作任意物體、完成任意任務。以抓取操作為例,相比現有基於特定物體和機械臂的方法,其在成功率、姿態多樣性及計算速度上均有顯著提升。 Visics大模型融合“具身世界模型”和“通用操作模型”兩大核心引擎,創新性地引入Object Trajectory作為中間接口,並以物體的連續3D點雲軌跡進行表徵。上層具身世界模型負責認知和預演物理軌跡,下層通用操作模

13 小時前
雷峰網生成式AI

ICML2026 |SEER:自動增強+替換Patch,同時搞定噪聲、異常、缺失、分佈偏移的新SOTA模型!

原文作者:公眾號-時序大模型原文鏈接:https://mp.weixin.qq.com/s/ZJfbE2OFeV9kZ6kBrLTsDg雷峰網轉載本篇論文來自ICML2026,最新前沿時序技術,針對時間序列預測,提出了名為SEER的Transformer魯棒時序預測框架,首次實現多類型低質量時序數據的統一魯棒建模。文章信息論文名稱:SEER:Transformer-based Robust Time Series Forecasting via Automated Patch Enhancement and Replacement論文作者:Xiangfei Qiu、 Xvyuan Liu、 Tianen Shen、 Xingjian Wu、 Hanyin Cheng、 Bin Yang1 Jilin Hu研究背景時間序列預測是支撐金融經濟研判、智慧交通調度、醫療健康監測、電力能源調控、環境氣象預警等諸多關鍵領域的核心基礎技術,精準的長短期時序預測結果能夠為行業資源動態調配、風險提前預警、智能化精準決策提供核心數據支撐,具備極高的學術研究價值與工程落地價值。在時序預測模型迭代發展歷程中,傳統循環神經網絡(RNN、LSTM、GRU)依賴串行迭代計算,存在長距離時序依賴捕捉能力弱、並行度低、訓練效率差的固有缺陷;CNN類模型僅能聚焦局部鄰域特徵,無法建模長時序關聯;而傳統線性時序模型泛化能力不足,難以適配複雜非線性時序場景。近年來,基於Patch分塊建模的Transformer時序模型憑藉創新性的時序切割思路,成為時序預測領域的主流SOTA方案,代表性模型包含PatchTST、Triformer、Crossformer、xPatch等。這類模型的核心優勢是打破逐時間步建模的侷限,將連續完整的長時序序列均勻切分為若干具備完整局部語義的子序列分塊,以Patch分塊作為基礎建模與Tra

14 小時前