谷歌雲發佈開放知識格式 OKF，打造 AI 代理標準化知識底座

2026年6月15日 03:307400 次瀏覽

重點摘要

谷歌雲推出“開放知識格式”（OKF），旨在通過標準化手段解決企業內部數據碎片化問題，為AI代理構建高效知識輸入體系。當前生成式AI落地中，PDF、Office等非結構化文檔解析困難，影響大模型語義理解與響應質量。OKF的發佈標誌著谷歌在AI基礎設施層面的關鍵佈局。

站內 AI 整理稿

### 谷歌雲推出開放知識格式 OKF，為 AI 代理打造標準化知識底座

谷歌雲近日發布了一項名為「開放知識格式」（Open Knowledge Format，OKF）的新方案，旨在透過標準化機制，解決企業內部長期存在的數據碎片化難題，為 AI 代理（AI Agent）提供更高效、更穩定的知識輸入基礎。這項布局不僅觸及生成式 AI 落地的核心痛點，也預示著雲端大廠正在從應用層回過頭來強化基礎設施層的競爭力。

#### 重點整理：OKF 是什麼？為何重要？

OKF 的核心目標是建立一套統一格式，讓企業內部的結構化與非結構化資料能被 AI 代理一致地讀取與理解。目前，多數企業仍仰賴 PDF、Office 文件等非結構化格式儲存大量營運知識與流程說明。然而，這些格式在傳遞給大型語言模型（LLM）時，往往因版面雜亂、語意模糊或內嵌圖表而導致解析錯誤，進而影響回答品質與下游任務準確度。OKF 透過預先定義的欄位與語意標記，能讓資料在存入雲端時就轉換為 AI 友善的結構，大幅降低後續「清洗」與「轉換」的成本。

#### 背景脈絡：生成式 AI 落地被「文件格式」卡住

過去一年，許多企業嘗試導入生成式 AI 以實現自動化客服、內部知識庫問答、合規審查等場景，但普遍遭遇一個隱形瓶頸：非結構化文件太多、太雜。舉例來說，一份合約可能包含表格、簽名欄、附註與掃描圖片，LLM 在讀取時容易混淆段落歸屬，甚至誤判關鍵條款。這種「格式鴻溝」迫使開發團隊投入大量時間在預處理管線（preprocessing pipeline）上，反而拖慢了模型上線速度。谷歌雲選擇從這個基礎環節切入，推出 OKF，可視為彌補 AI 代理與企業真實資料之間斷層的關鍵一步。

#### 可能影響：從資料儲存到 AI 代理生態的連鎖效應

OKF 的出現，可能從三個層面產生影響。首先，對企業 IT 部門而言，未來在規劃資料架構時，或許會優先考慮支援 OKF 的儲存方案，從而降低後續導入 AI 時的整合難度。其次，對於 AI 代理開發者，OKF 將減少因格式不符而需反覆除錯的時間，讓開發焦點回歸到模型推理邏輯與業務流程設計。最後，在產業競爭上，谷歌雲此舉可能帶動 AWS、Microsoft Azure 跟進類似標準，甚至催生跨雲的開放格式聯盟，進一步加速 AI 代理的標準化進程。

#### 讀者可關注的後續：生態擴張與實戰案例

接下來值得關注的幾個方向包括：OKF 是否會整合至 Google Workspace 的生產力工具（如 Docs、Sheets），讓使用者無痛產出符合格式的內容？此外，谷歌雲是否會推出配套的轉換工具與 API，協助企業將既有 PDF 或 Office 檔案批次轉成 OKF 格式？另一個觀察重點是，大型開源社群（如 Hugging Face）或第三方資料平台是否願意採用或相容 OKF，這將決定此格式能否真正成為業界共識。

#### 結語：AI 基礎設施之戰從「格式」開打

谷歌雲選擇從最底層的資料格式切入，看似樸素，實則精準。當多數競爭者仍在比拼模型參數與算力規模時，OKF 直接回應了企業導入生成式 AI 最常遇到的「資料消化不良」問題。這項布局若成功，不僅能讓谷歌雲的 AI 代理產品更具易用性，也為後續的跨系統協作鋪平道路。可以預見，未來半年內，市場上將出現更多圍繞「標準化知識輸入」的討論與產品發布，而 OKF 是否真能成為 AI 代理的通用知識底座，取決於它能否快速累積真實企業的導入案例與社群回饋。

原始來源：AIBase ↗

查看原始來源

TechWebAI Agent

網易有道全面向AI轉型全場景Agent矩陣亮相圖博會

{"id":"39ef5947-b77a-4904-bf03-ff6264f08dc4","object":"response","model":"deepseek-v4-flash","output":[],"stop_reason":"max_output_tokens","usage":{"input_tokens":154,"output_tokens":200,"total_tokens":354}}

剛剛閱讀分析

Hugging Face BlogAI Agent

MosaicLeaks: Can your research agent keep a secret?

Back to Articles MosaicLeaks: Can your research agent keep a secret? Enterprise Article Published June 18, 2026 Upvote - Alexander Gurung agurung Follow ServiceNow Rafael Pardinas rafapi-snow Follow ServiceNow TL;DR Deep research agents increasingly combine private local documents with external tools like web retrieval, creating a privacy risk: an agent's external queries may leak sensitive information. MosaicLeaks proposes a new deep-research task with multi-hop questions that interleave public and private information. Across the models we tested, agents frequently leaked private information, and training only for task performance made it worse. We propose a mosaic-leakage-aware RL training method, Privacy-Aware Deep Research (PA-DR), which raises strict chain success (the share of chains

17 小時前閱讀分析