Hugging Face Blog研究與前沿

OlmoEarth v1.1:更高效的地球觀測模型系列

2026年5月19日 18:38

重點摘要

AI2發布OlmoEarth v1.1,這一系列地球觀測模型將運算成本降低高達3倍,同時維持與v1版本相同的效能。效率提升的關鍵在於減少Transformer模型處理衛星影像時的token序列長度,從而顯著節省計算資源。這項更新使得大規模部署地球觀測AI更為經濟可行,有助於擴大應用範圍,例如追蹤紅樹林變化、繪製國家級

站內 AI 整理稿

### OlmoEarth v1.1 登場:三倍運算效率,地球觀測 AI 更接地氣

地球觀測 AI 模型正迎來關鍵進展。Allen AI 團隊於今年五月釋出 OlmoEarth v1.1,這是一款專為衛星影像分析設計的 Transformer 模型家族,最大的亮點在於將運算成本壓縮至前一代(v1)的三分之一,同時維持相近的預測效能。這項更新不僅讓大規模地表監測變得更 affordable,也為環境保護與農業應用開啟了更即時、更低門檻的可能性。

### 從 v1 到 v1.1:效率成為核心驅動力

回顧背景,OlmoEarth v1 在去年十一月問世後,已廣泛應用於紅樹林變遷追蹤、森林流失原因分類、乃至產出國家級作物類型地圖等任務。團隊的目標是將最先進的 AI 帶給致力於保護地球的組織與社群。然而,在實際部署中,從資料匯出、前處理、模型推理到後處理,運算資源始終是最高成本。特別是當模型需要處理數萬到數十萬平方公里的衛星影像時,效率直接決定了應用規模的上限。因此,v1.1 的設計邏輯非常明確:在不犧牲準確度的前提下,想辦法「用更少的計算做更多的事」。

### 關鍵技術:重新定義「Token」的組成

Transformer 模型的運算成本與輸入序列長度呈二次方關係。OlmoEarth v1.1 的突破點在於改變了衛星影像 Token 的生成方式。以 Sentinel-2 資料為例,原始影像包含多個空間解析度(10 米、20 米、60 米)與多個時間點。在 v1 中,每個解析度、每個時間點各自產生一個 Token,導致序列長度暴增;而 v1.1 將不同解析度的頻段合併為單一 Token,一口氣將 Token 數量縮減為三分之一。

當然,這種「暴力合併」並非沒有代價。研究團隊發現,單純合併會讓重要任務(如 m-eurosat kNN 分類)的準確率下降約 10 個百分點,因為不同解析度的頻段間存在複雜的交叉關係。為了解決這個問題,他們修改了預訓練階段的策略,讓模型學會從合併後的 Token 中還原出這些關係。詳細的技術調整已在技術報告中公開,這也是開發者與研究者最值得深讀的部分。

### 對開發者與研究者的實際影響

對於正在使用 OlmoEarth v1 的開發者來說,v1.1 提供了一個直接升級路徑:同樣的模型尺寸,運算成本僅為前代的三分之一。在微調與推理階段,速度提升非常顯著。不過,團隊也坦承部分任務可能出現效能衰退,建議使用者在自己的資料集上先進行驗證。對於研究者而言,這項工作展示了「序列壓縮」在地球觀測模型中的巨大潛力,也點出了一個新問題:如何在極度壓縮的 Token 表示中保留多尺度時空資訊?後續可以關注團隊是否會釋出更多關於預訓練策略調校的細節。

### 後續關注:從節省成本到擴大應用場景

OlmoEarth v1.1 的意義不僅在於降低單次運算費用,更在於讓「高頻率、大範圍」的地圖更新成為可能。過去受限於運算預算,許多組織只能一年更新一次國家級土地利用圖;現在或許能以月為單位進行監測,及時掌握森林砍伐、水體變化或農作物生長狀況。此外,平台化的支援也意味著更多非營利組織或小型團隊能夠負擔這項技術。下一步值得觀察的是,v1.1 能否在 Sentinel-1 雷達影像或其他感測器資料上複製同樣的效率提升,以及這套 token 壓縮方法是否適用於其他遙感基礎模型(如 Prithvi、SatMAE 等)。有興趣的讀者可直接前往 Hugging Face 模型頁面下載權重,並參考 GitHub 上的預訓練程式碼與技術報告,親身體驗這個更輕巧、更快速的地球觀測工具。

Related

相關文章

GPT發AI原創新成果了

這篇消息聚焦「GPT發AI原創新成果了」。原始導語提到:AI實現藥物全自動研發,還遠嗎? 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛

AI越強,越要“殺死”過去的自己

這篇消息聚焦「AI越強,越要“殺死”過去的自己」。原始導語提到:人類需要實現思維模式的轉變。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 小時前
MarkTechPost AI研究與前沿

Salesforce CodeGen Tutorial: Generate, Validate, and Rerank Python Functions With Unit Tests and Safety Checks

In this tutorial, we implement an end-to-end workflow for Salesforce CodeGen. We load a CodeGen model from Hugging Face, prepare it for code generation, and use it to generate Python functions from natural-language prompts. We then move beyond basic inference by adding function extraction, syntax checking, static safety checks, unit-test-based validation, best-of-N candidate reranking, multi-step program synthesis, prompt-style experimentation, benchmark visualization, and artifact export. Through this workflow, we learn how CodeGen can be used not only as a code completion model but also as part of a structured code-generation pipeline that evaluates, filters, and organizes generated solutions. Loading the Salesforce CodeGen Model from Hugging Face Copy CodeCopiedUse a different Browserim

8 小時前

Transformer之父離開谷歌,奧特曼等了他十年

這篇消息聚焦「Transformer之父離開谷歌,奧特曼等了他十年」。原始導語提到:27億美元也沒能留住,Noam Shazeer追尋下一代架構。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

16 小時前

Dario訪談首曝:Mythos被稱為“超級武器”

這篇消息聚焦「Dario訪談首曝:Mythos被稱為“超級武器”」。原始導語提到:在這場69分鐘完整訪談裡,Dario Amodei 說人類真正面對的不是某個突然降臨的奇點,而是一條已經開始垂直起飛的指數曲線。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

19 小時前

用結構替代數據,因果世界模型如何重塑具身智能大腦

這篇消息聚焦「用結構替代數據,因果世界模型如何重塑具身智能大腦」。原始導語提到:因果世界模型需要一個標誌性的時刻來證明自己。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

20 小時前