分類頻道

模型更新

219 篇文章,依最新發布時間排序。

MarkTechPost AI模型更新

Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight

Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for. What is Perplexity‘s Brain Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview. Two Axes of AI Memory Perp

14 小時前

智譜新高,MiniMax承壓,“大模型雙雄”命運殊途

這篇消息聚焦「智譜新高,MiniMax承壓,“大模型雙雄”命運殊途」。原始導語提到:大模型在被市場重新定價 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

16 小時前
MarkTechPost AI模型更新

OpenAI Releases LifeSciBench, a 750-Task Benchmark Grading AI Models on Real Life-Science Research With Expert-Written Rubric

Most biology benchmarks ask narrow, fact-based questions with clean answers. Scientists weigh imperfect evidence and make decisions. OpenAI released LifeSciBench and it targets that gap directly. Even the strongest model passes roughly one task in three. The benchmark is far from saturated. What is LifeSciBench LifeSciBench contains 750 expert-authored tasks. They span seven workflows and seven biological domains. Each task pairs a prompt, supporting artifacts, and a grading rubric. The seven workflows cover evidence handling and analysis. They also include design and optimization, scientific reasoning, validation and operations, translation, and scientific communication. The seven domains run from genomics and medicinal chemistry to clinical and translational science. Tasks are written as

1 天前
Hugging Face Blog模型更新

Is it agentic enough? Benchmarking open models on your own tooling

Back to Articles Is it agentic enough? Benchmarking open models on your own tooling Published June 18, 2026 Update on GitHub Upvote 2 Lysandre lysandre Follow Nathan Habib SaylorTwift Follow Pedro Cuenca pcuenq Follow Benchmarking transformers revisions across different metrics This is a human-made, agent-focused blogpost. Coding agents increasingly work with our software instead of us: describe a task, and the agent picks the library, writes the calls, runs them, and debugs its own mistakes. When the library gets in the way, it will happily bypass it and rewrite the logic from scratch. This introduces a new concept in library development: the code should not only be correct and fast, but should be designed so that an agent can drive it effectively. A clunky API or stale docs annoy us deve

1 天前
量子位模型更新

Grok 4.3現已在Amazon Bedrock上正式可用

xAI 正式加入 Amazon Bedrock 模型供應商行列,其推出的 Grok 4.3 模型現已於該平台上線提供服務。使用者可透過 Amazon Bedrock 直接取用此模型進行相關應用開發與部署。

1 天前
智東西模型更新

微信給AI發“錢包”,轉它200元全花光了!

AI應用風向標(公眾號:ZhidxcomAI) 作者|畢偉豪 編輯|李水青 智東西6月17日報道,今日,微信支付正式發佈面向Agent消費的“AI專屬卡”,騰訊AI辦公助手WorkBuddy首發接入。簡單來說,用戶可以通過這張卡,在WorkBuddy中提出消費需求,從團購推薦到下單支付都由Agent完成。 我們第一時間就這張AI專屬卡進行了體驗,在WorkBuddy中已經支持體驗購買團購券等功能,但對於很多人所期待的點外賣,AI專屬卡目前還不支持。 體驗發現,通過WorkBuddy進行團購,我們可以買到一些在美團APP上找不到的團購券,還能小小的薅一下肯德基的羊毛。 同時,這張AI專屬卡中的資金是完全獨立的,而且只會在Agent支付的場景中被啟用,且每次支付都會由本人進行確認,不用擔心資金被AI隨意揮霍。 目前這個功能只能在WorkBuddy的客戶端使用,用戶在手機APP裡雖然也可以召喚美團生活助手,但卻不能使用AI專屬卡進行支付。 一、兩杯星冰樂39.9元,KFC團購便宜一塊多 要使用這張卡非常簡單,用戶只需要在WorkBuddy之中召喚美團生活助手這個專家,就可以讓它幫忙領優惠券以及下單支付。 召喚專家後可以先讓他幫忙領一下優惠券,種類和數額還是比較可觀的,只不過現在好像因為訪問人數過多,這項服務暫時失效了。 用戶提出消費需求之後,WorkBuddy會搜索並展示對應的團購券,比如我讓它在公司附近的蘭州拉麵店幫我團一個券,它很快就找到了在公司樓下的一家門店。 隨後我選擇了下單,確認下單後會彈出一個AI支付的鏈接,選擇授權支付以後會出現一個二維碼,用微信掃碼即可綁定AI專屬卡。綁定之後的每一次支付都會出現一個二維碼,也就是說每一次的支付都會經由本人確認。 接下來要做的事情就是給這張卡進行充值,然後就可以選擇支付、輸入密碼完成訂單,點開美團APP之後可以發現這張團購券已經出現

1 天前
Hugging Face Blog模型更新

GLM-5.2:專為長時程任務打造

我們推出GLM-5.2,這是專為長時程任務設計的最新旗艦模型。相較於前代GLM-5.1,它在長時程任務能力上實現大幅躍進,並首次在穩定的100萬token上下文中展現此能力。GLM-5.2的新功能包括:穩定的100萬上下文、具備多種思考努力程度的進階編碼能力以平衡效能與延遲,以及改良架構IndexShare(每四層稀疏注意力層共享同一個索引器),在100萬上下文長度下將每個token的FLOPs減少2.9倍。

2 天前
鈦媒體模型更新

Edge AI Daily 早報(6月17日)

美國政府首次對已部署AI模型實施出口管制,強制Anthropic全球停用Fable 5與Mythos 5,標誌著AI管控從硬件升級至模型權重層面。智譜AI在禁令後72小時內發佈GLM-5.2,以100萬token上下文窗口和MIT開源協議登陸OpenRouter,開啟中國大模型的全球開源基礎設施路線。

2 天前
雷峰網模型更新

刷新權威榜單SOTA!ACE-Ego 解鎖“以人為中心”的規模化具身模型訓練新範式

近日,大曉機器人聯合香港中文大學多媒體實驗室(CUHK MMLab)正式發佈全新“一腦多型”具身操作VLA模型 ACE-Ego,並向行業開源。作為“以人為中心”ACE 研發範式在具身模型預訓練的核心落地成果,ACE-Ego提出大規模第一視角人類視頻與多型機器人數據高效聯合預訓練的新範式,在兩大國際權威具身智能基準上雙雙領先,並在複雜零售場景中展現出強泛化落地能力,為具身操作模型的規模化演進開闢了全新路徑。 在國際公認的人形機器人操作基準 RoboCasa GR1 TableTop 上,ACE-Ego 以72.8%的平均成功率刷新當前最高紀錄,奪得榜首,大幅超越英偉達 GR00T、PI π₀.₅、京東JoyAI-RA 等主流模型;在高難度雙臂操作基準 RoboTwin 2.0 的強域隨機化測試中,ACE-Ego 以90.62%的成功率展現出遠超行業平均水平的環境魯棒性。2025年12月,大曉機器人提出“以人為中心(Human-centric)” 的ACE具身研發範式,將人類與物理世界的互動規律作為核心研究起點,構建了一套從“環境式數據採集—開悟世界模型3.0—具身交互”的全鏈路技術體系。源於對 “以人為中心” ACE 範式的深度踐行,不同於行業傳統 “以機器為中心”、依賴大批量高成本真機遙操作數據的路線,ACE-Ego 將海量低成本的第一視角人類視頻轉化為可用於模型訓練的有效監督信號。通過統一相機空間動作表示、統一本體形態編碼、時間對齊動態分塊、可靠性自適應目標函數四大核心機制,它系統性破解了人與不同型號機器人數據在空間座標系、本體結構、時序頻率、標籤質量上的四重異構難題,實現使用大規模高質量人類第一視角視頻與數千小時多機型機器人數據的協同訓練。實驗結果證實了大規模第一視角人類視頻能夠有效提升VLA模型預訓練和下游適配能力:在 RoboCasa 基準上,引入第一視角人類視頻進

2 天前
雷峰網模型更新

DeepSeek完成500億融資,採用特殊架構保梁文鋒控權;被約談後,山姆總部更換董事長;豪擲20億元股權!理想重賞三大高管,市值1萬億元可解鎖兌現

要聞提示1.DeepSeek完成超500億創紀錄融資,採用特殊架構保梁文鋒控權2.蔚來李斌:今年是我進入汽車行業以來最難的一年,新樂道 L60 不至於賣一輛虧一輛3.被約談後,山姆總部更換董事長,其曾在阿里巴巴擔任高管4.豪擲20億元股權!理想重賞三大高管,市值1萬億元可解鎖兌現5.字節豆包日收入不足百萬,Seedance毛利率達70%6.小紅書選定高盛、中金籌備香港IPO,最早下半年上市7.2.75萬億美元!SpaceX總市值超越亞馬遜,馬斯克身家相當於8.8個巴菲特今日頭條DeepSeek完成超500億創紀錄融資,採用特殊架構保梁文鋒控權6月16日消息,據報道,DeepSeek在首輪融資中籌得逾500億元人民幣(74億美元),估值超500億美元(約合人民幣3380億元),並採用了旨在維持創始人控制權的交易結構。這是中國AI行業迄今規模最大的單輪融資。據知情人士透露,除國家人工智能產業投資基金外,所有外部投資方的資金需注入由梁文鋒管理的有限合夥企業,而非直接投向DeepSeek主體。報道稱,投資者需遵守五年鎖定期,且不享有表決權。梁文鋒身邊人士透露,他堅定主張AI技術開源、讓技術普惠大眾,五年鎖定期正是為了篩選出不追求短期套現的長期資本。另一項特殊條款同樣引發關注:梁文鋒團隊要求核查所有出資基金背後的有限合夥人真實身份,規避股權最終流入不明主體手中的風險。此前報道,創始人梁文鋒在本輪融資中個人投資200億元,此外騰訊正考慮投資100億元,寧德時代則計劃投資50億元,這將使它們成為本輪融資中最大的外部投資者。(環球市場播報、獨角獸早知道)國內資訊蔚來李斌:今年是我進入汽車行業以來最難的一年,新樂道 L60 不至於賣一輛虧一輛6 月 16 日消息,據報道,日前,蔚來創始人、董事長李斌在接受採訪時直言:“我進入汽車行業這麼多年,今年是真正最難的一年。”新樂道 L60 汽車於 6

2 天前