AI數據庫交互迎來里程碑：谷歌新模型Gemini-SQL2 刷新行業標杆

2026年6月15日 02:31

重點摘要

Google Research於6月12日發佈Gemini-SQL2模型，基於Gemini3.1Pro打造，專注於“文本轉SQL”任務，能精準將日常對話轉化為數據庫查詢指令，在權威評測中登頂，推動AI理解與處理數據庫查詢技術的突破。

站內 AI 整理稿

## 谷歌Gemini-SQL2重磅登場：自然語言直轉SQL再創新高，80%準確率改寫數據查詢規則

AI與數據庫之間的「對話」障礙，正被Google Research以驚人的速度破除。在2026年6月12日，Google Research正式宣布推出Gemini-SQL2，這項基於最新旗艦模型Gemini 3.1 Pro所打造的文本轉SQL能力，在權威評測中創下高達80.04%的執行準確率，不僅超越了自家的前代模型Gemini-SQL，更擊敗了AWS、Databricks、騰訊、Snowflake等多個強勁競爭對手，一舉登上BIRD單模型排行榜的頂端。這項技術的核心價值在於，它讓使用者不再需要親手撰寫複雜的SQL語法，只需用日常對話的方式提問，系統就能自動生成可實際運行的資料庫查詢指令，堪稱AI輔助數據分析的關鍵里程碑。

### 從日常對話到資料查詢：為何Text-to-SQL如此困難？

要理解Gemini-SQL2的突破性，首先要認識Text-to-SQL（文本轉SQL）這項技術的基本運作邏輯。所謂Text-to-SQL，就是將人類的自然語言問題，自動轉換成SQL資料庫查詢語言，讓使用者可以用「上個月台北地區業績最高的產品是哪一款？」這類日常說法，取代繁雜的SELECT、JOIN、WHERE等程式語法。然而，這項任務的難度遠比表面上看起來更高——除了要理解問題本身的語法和語意，模型還必須掌握資料庫的表格結構、欄位名稱、資料型態，以及各種業務邏輯上的細微差異。舉例來說，「流失客戶」在不同公司的定義可能截然不同，模型必須能夠判斷這些隱含規則，才能產出真正符合需求的SQL查詢。這也是為什麼Text-to-SQL長期以來被視為AI領域最困難的挑戰之一，而Gemini-SQL2正是在這條艱難的道路上取得了重大突破。

### BIRD基準的真正考驗：不只語法正確，更要能實際執行

Gemini-SQL2所征服的BIRD（Big Bench for Large-Scale Database Grounded Text-to-SQL Evaluation）基準，是當前業界公認最具鑑別度的文本轉SQL評測標準。與過去的Spider等早期基準不同，BIRD涵蓋了95個真實資料庫、橫跨37個專業領域，總計包含12751組問題與SQL配對，資料量高達33.4GB。更關鍵的是，BIRD的評測機制要求生成的SQL不僅要看起來語法正確，更必須能在實際資料庫中執行，並回傳與標準答案完全一致的結果——這與傳統僅檢查SQL語法的評測方式有著天壤之別。此外，BIRD的資料庫還包含了髒數據和外部知識需求，場景設計極度貼近真實企業環境。Gemini-SQL2能夠在這種高強度考驗下取得80.04%的執行準確率，不僅大幅超越Google先前保持的76.13%記錄，更證明了這套系統已具備處理複雜商業查詢的實戰能力。

### 商業應用的革命：誰能受惠於這項技術？

從實際應用場景來看，Gemini-SQL2的出現將對多個領域產生深遠影響。最直接的受惠者是企業內部的業務分析人員——過去他們若要從數據中提取關鍵洞察，往往得仰賴數據工程師撰寫SQL，溝通成本高且耗時。有了Gemini-SQL2，業務人員只需用口語提問「請幫我分析升級方案後90天內流失的客戶，其每月經常性收入的變化趨勢」，系統便能自動處理複雜的多表聯結與時間窗口邏輯，在幾秒鐘內產出結果。對於SaaS軟體業者而言，這項技術同樣極具價值——過去要在產品中內建「詢問您的數據」功能，必須自行開發NL2SQL引擎，成本高昂且準確率難以保證。Gemini-SQL2高達80%的基礎準確率，讓軟體廠商能夠快速導入智慧查詢功能，只需搭配簡單的人工確認機制即可上線。Google本身也預期這項技術將深度整合進BigQuery Studio、AlloyDB AI及Cloud SQL Studio等數據服務中，讓使用者能在Google Cloud控制台中直接用英語提問，系統自動生成並驗證SQL。

### 競爭格局洗牌：Google如何透過Gemini-SQL2拉開差距？

在生成式AI的競賽中，Google正透過Gemini-SQL2展現其在垂直領域的深厚實力。根據BIRD排行榜的數據，Gemini-SQL2不僅超越了自家的前代模型，更以明顯優勢領先OpenAI的GPT-5.5-xhigh（約72.8%）及Anthropic的Claude Opus 4.6（約70.9%）。這樣的成績背後，得益於Gemini 3.1 Pro強大的基礎能力——這款旗艦模型在2026年2月推出時，就在ARC-AGI-2推理基準上達到77.1%高分，推理性能較前代提升超過兩倍，並支援高達100萬個詞元的上下文處理，能一次消化數十篇研究論文或整個程式碼庫。Gemini-SQL2正是在這樣堅實的基礎上，進一步針對SQL生成任務進行深度優化，並在BIRD的「單模型」賽道中憑藉自身推理能力登頂，展現出無需外部檢索增強或智能體框架輔助的純粹實力。

### 仍有進步空間：80%準確率不代表完美自動化

儘管Gemini-SQL2創下新高，但持平而論，這項技術距離完全取代人類數據工程師仍有相當距離。相較於人類專家在BIRD基準上92.96%的表現，Gemini-SQL2的80.04%意味著每五個查詢中仍有一個可能出錯。剩餘的錯誤類型多半源自於對模糊業務術語的誤解，或是對極端邊緣案例的處理不當。這也說明了當前文本轉SQL技術的定位應是「輔助增強」，而非「完全自動化」。特別是在金融、醫療等高風險領域，人工審查機制仍然是不可或缺的安全防線。換句話說，Gemini-SQL2的價值在於讓數據分析師從繁重的基礎SQL撰寫工作中解放出來，將精力集中在更複雜的業務邏輯判斷與結果驗證上，而非完全取代數據專業人員的判斷。

### 後續關注焦點：產品落地與技術報告何時釋出？

值得留意的是，Google目前尚未公布Gemini-SQL2的具體API介面、模型卡或技術報告，也未確認哪些產品將會率先導入這項技術。從Google在X平台上的官方說法來看，該公司提到「改善SQL理解能力可提升Google數據服務中的自然語言功能」，暗示BigQuery Studio、AlloyDB AI及Cloud SQL Studio很可能會是第一批整合對象。後續值得讀者關注的重點包括：Google何時發布正式的技術論文、Gemini-SQL2是否會以API形式開放給第三方開發者使用，以及這項技術將以何種方式導入Google Cloud的企業服務中。隨著文本轉SQL技術的不斷演進，未來我們很可能見證企業數據分析工作流程的根本性變革——當資料庫查詢變得像對話一樣自然，數據的價值將不再被技術門檻所束縛，真正回歸到洞察與決策本身。

原始來源：AIBase ↗

查看原始來源

IT之家自然語言處理

最強文本轉 SQL 任務 AI 模型：谷歌發佈 Gemini-SQL2，準確率 80.04% 登頂

Google Research 昨日（6 月 12 日）發佈公告，宣佈推出 Gemini-SQL2 模型，基於 Gemini 3.1 Pro 打磨，具備 Text-to-SQL 能力。

1 週前閱讀分析

36氪自然語言處理

“Token”必須死？

36氪這篇消息聚焦「“Token”必須死？」。原摘要指出：語言模型的“思考”不必逐字發生。這則內容已被收錄為 AI 情報追蹤項目，後續可從技術進展、產品落地、產業競爭或市場影響等角度持續觀察。

3 週前閱讀分析

相關文章

最強文本轉 SQL 任務 AI 模型：谷歌發佈 Gemini-SQL2，準確率 80.04% 登頂

“Token”必須死？