AIBaseAI Agent

谷歌雲發佈開放知識格式 OKF,打造 AI 代理標準化知識底座

2026年6月15日 03:307400 次瀏覽

重點摘要

谷歌雲推出“開放知識格式”(OKF),旨在通過標準化手段解決企業內部數據碎片化問題,為AI代理構建高效知識輸入體系。當前生成式AI落地中,PDF、Office等非結構化文檔解析困難,影響大模型語義理解與響應質量。OKF的發佈標誌著谷歌在AI基礎設施層面的關鍵佈局。

站內 AI 整理稿

### 谷歌雲推出開放知識格式 OKF,為 AI 代理打造標準化知識底座

谷歌雲近日發布了一項名為「開放知識格式」(Open Knowledge Format,OKF)的新方案,旨在透過標準化機制,解決企業內部長期存在的數據碎片化難題,為 AI 代理(AI Agent)提供更高效、更穩定的知識輸入基礎。這項布局不僅觸及生成式 AI 落地的核心痛點,也預示著雲端大廠正在從應用層回過頭來強化基礎設施層的競爭力。

#### 重點整理:OKF 是什麼?為何重要?

OKF 的核心目標是建立一套統一格式,讓企業內部的結構化與非結構化資料能被 AI 代理一致地讀取與理解。目前,多數企業仍仰賴 PDF、Office 文件等非結構化格式儲存大量營運知識與流程說明。然而,這些格式在傳遞給大型語言模型(LLM)時,往往因版面雜亂、語意模糊或內嵌圖表而導致解析錯誤,進而影響回答品質與下游任務準確度。OKF 透過預先定義的欄位與語意標記,能讓資料在存入雲端時就轉換為 AI 友善的結構,大幅降低後續「清洗」與「轉換」的成本。

#### 背景脈絡:生成式 AI 落地被「文件格式」卡住

過去一年,許多企業嘗試導入生成式 AI 以實現自動化客服、內部知識庫問答、合規審查等場景,但普遍遭遇一個隱形瓶頸:非結構化文件太多、太雜。舉例來說,一份合約可能包含表格、簽名欄、附註與掃描圖片,LLM 在讀取時容易混淆段落歸屬,甚至誤判關鍵條款。這種「格式鴻溝」迫使開發團隊投入大量時間在預處理管線(preprocessing pipeline)上,反而拖慢了模型上線速度。谷歌雲選擇從這個基礎環節切入,推出 OKF,可視為彌補 AI 代理與企業真實資料之間斷層的關鍵一步。

#### 可能影響:從資料儲存到 AI 代理生態的連鎖效應

OKF 的出現,可能從三個層面產生影響。首先,對企業 IT 部門而言,未來在規劃資料架構時,或許會優先考慮支援 OKF 的儲存方案,從而降低後續導入 AI 時的整合難度。其次,對於 AI 代理開發者,OKF 將減少因格式不符而需反覆除錯的時間,讓開發焦點回歸到模型推理邏輯與業務流程設計。最後,在產業競爭上,谷歌雲此舉可能帶動 AWS、Microsoft Azure 跟進類似標準,甚至催生跨雲的開放格式聯盟,進一步加速 AI 代理的標準化進程。

#### 讀者可關注的後續:生態擴張與實戰案例

接下來值得關注的幾個方向包括:OKF 是否會整合至 Google Workspace 的生產力工具(如 Docs、Sheets),讓使用者無痛產出符合格式的內容?此外,谷歌雲是否會推出配套的轉換工具與 API,協助企業將既有 PDF 或 Office 檔案批次轉成 OKF 格式?另一個觀察重點是,大型開源社群(如 Hugging Face)或第三方資料平台是否願意採用或相容 OKF,這將決定此格式能否真正成為業界共識。

#### 結語:AI 基礎設施之戰從「格式」開打

谷歌雲選擇從最底層的資料格式切入,看似樸素,實則精準。當多數競爭者仍在比拼模型參數與算力規模時,OKF 直接回應了企業導入生成式 AI 最常遇到的「資料消化不良」問題。這項布局若成功,不僅能讓谷歌雲的 AI 代理產品更具易用性,也為後續的跨系統協作鋪平道路。可以預見,未來半年內,市場上將出現更多圍繞「標準化知識輸入」的討論與產品發布,而 OKF 是否真能成為 AI 代理的通用知識底座,取決於它能否快速累積真實企業的導入案例與社群回饋。

Related

相關文章

Hugging Face BlogAI Agent

MosaicLeaks: Can your research agent keep a secret?

Back to Articles MosaicLeaks: Can your research agent keep a secret? Enterprise Article Published June 18, 2026 Upvote - Alexander Gurung agurung Follow ServiceNow Rafael Pardinas rafapi-snow Follow ServiceNow TL;DR Deep research agents increasingly combine private local documents with external tools like web retrieval, creating a privacy risk: an agent's external queries may leak sensitive information. MosaicLeaks proposes a new deep-research task with multi-hop questions that interleave public and private information. Across the models we tested, agents frequently leaked private information, and training only for task performance made it worse. We propose a mosaic-leakage-aware RL training method, Privacy-Aware Deep Research (PA-DR), which raises strict chain success (the share of chains

17 小時前
量子位AI Agent

騰訊老兵+大廠00後新銳,碼上飛想做的不只是AI Coding

這篇消息聚焦「騰訊老兵+大廠00後新銳,碼上飛想做的不只是AI Coding」。原始導語提到:已接入華為鴻蒙生態 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

17 小時前

21年老牌企服公司的AI實驗:讓Agent跑一遍流程

這篇消息聚焦「21年老牌企服公司的AI實驗:讓Agent跑一遍流程」。原始導語提到:司盟企服接入騰訊雲WorkBuddy後,將海外郵件管理、審計理賬、訂單審核等高頻交付流程交給Agent先跑一遍 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

19 小時前
TechWebAI Agent

曹操出行宣佈啟動全面AI轉型,組織升級向AI原生公司邁進

曹操出行在2026國際汽車及供應鏈博覽會 上宣佈啟動全面AI轉型,併發布RoboX戰略,打造全球領先的物理AI移動科技平臺。與此同時,公司正式啟動組織升級,加快向AI原生公司邁進。為推動全面AI轉型,今年上半年,公司推進戰略聚焦,持續優化業務結構,主動收縮非核心業務,加快向AI原生公司轉型。

21 小時前