AI數據庫交互迎來里程碑:谷歌新模型Gemini-SQL2 刷新行業標杆

2026年6月15日 02:31

重點摘要

Google Research於6月12日發佈Gemini-SQL2模型,基於Gemini3.1Pro打造,專注於“文本轉SQL”任務,能精準將日常對話轉化為數據庫查詢指令,在權威評測中登頂,推動AI理解與處理數據庫查詢技術的突破。

站內 AI 整理稿

## 谷歌Gemini-SQL2重磅登場:自然語言直轉SQL再創新高,80%準確率改寫數據查詢規則

AI與數據庫之間的「對話」障礙,正被Google Research以驚人的速度破除。在2026年6月12日,Google Research正式宣布推出Gemini-SQL2,這項基於最新旗艦模型Gemini 3.1 Pro所打造的文本轉SQL能力,在權威評測中創下高達80.04%的執行準確率,不僅超越了自家的前代模型Gemini-SQL,更擊敗了AWS、Databricks、騰訊、Snowflake等多個強勁競爭對手,一舉登上BIRD單模型排行榜的頂端。這項技術的核心價值在於,它讓使用者不再需要親手撰寫複雜的SQL語法,只需用日常對話的方式提問,系統就能自動生成可實際運行的資料庫查詢指令,堪稱AI輔助數據分析的關鍵里程碑。

### 從日常對話到資料查詢:為何Text-to-SQL如此困難?

要理解Gemini-SQL2的突破性,首先要認識Text-to-SQL(文本轉SQL)這項技術的基本運作邏輯。所謂Text-to-SQL,就是將人類的自然語言問題,自動轉換成SQL資料庫查詢語言,讓使用者可以用「上個月台北地區業績最高的產品是哪一款?」這類日常說法,取代繁雜的SELECT、JOIN、WHERE等程式語法。然而,這項任務的難度遠比表面上看起來更高——除了要理解問題本身的語法和語意,模型還必須掌握資料庫的表格結構、欄位名稱、資料型態,以及各種業務邏輯上的細微差異。舉例來說,「流失客戶」在不同公司的定義可能截然不同,模型必須能夠判斷這些隱含規則,才能產出真正符合需求的SQL查詢。這也是為什麼Text-to-SQL長期以來被視為AI領域最困難的挑戰之一,而Gemini-SQL2正是在這條艱難的道路上取得了重大突破。

### BIRD基準的真正考驗:不只語法正確,更要能實際執行

Gemini-SQL2所征服的BIRD(Big Bench for Large-Scale Database Grounded Text-to-SQL Evaluation)基準,是當前業界公認最具鑑別度的文本轉SQL評測標準。與過去的Spider等早期基準不同,BIRD涵蓋了95個真實資料庫、橫跨37個專業領域,總計包含12751組問題與SQL配對,資料量高達33.4GB。更關鍵的是,BIRD的評測機制要求生成的SQL不僅要看起來語法正確,更必須能在實際資料庫中執行,並回傳與標準答案完全一致的結果——這與傳統僅檢查SQL語法的評測方式有著天壤之別。此外,BIRD的資料庫還包含了髒數據和外部知識需求,場景設計極度貼近真實企業環境。Gemini-SQL2能夠在這種高強度考驗下取得80.04%的執行準確率,不僅大幅超越Google先前保持的76.13%記錄,更證明了這套系統已具備處理複雜商業查詢的實戰能力。

### 商業應用的革命:誰能受惠於這項技術?

從實際應用場景來看,Gemini-SQL2的出現將對多個領域產生深遠影響。最直接的受惠者是企業內部的業務分析人員——過去他們若要從數據中提取關鍵洞察,往往得仰賴數據工程師撰寫SQL,溝通成本高且耗時。有了Gemini-SQL2,業務人員只需用口語提問「請幫我分析升級方案後90天內流失的客戶,其每月經常性收入的變化趨勢」,系統便能自動處理複雜的多表聯結與時間窗口邏輯,在幾秒鐘內產出結果。對於SaaS軟體業者而言,這項技術同樣極具價值——過去要在產品中內建「詢問您的數據」功能,必須自行開發NL2SQL引擎,成本高昂且準確率難以保證。Gemini-SQL2高達80%的基礎準確率,讓軟體廠商能夠快速導入智慧查詢功能,只需搭配簡單的人工確認機制即可上線。Google本身也預期這項技術將深度整合進BigQuery Studio、AlloyDB AI及Cloud SQL Studio等數據服務中,讓使用者能在Google Cloud控制台中直接用英語提問,系統自動生成並驗證SQL。

### 競爭格局洗牌:Google如何透過Gemini-SQL2拉開差距?

在生成式AI的競賽中,Google正透過Gemini-SQL2展現其在垂直領域的深厚實力。根據BIRD排行榜的數據,Gemini-SQL2不僅超越了自家的前代模型,更以明顯優勢領先OpenAI的GPT-5.5-xhigh(約72.8%)及Anthropic的Claude Opus 4.6(約70.9%)。這樣的成績背後,得益於Gemini 3.1 Pro強大的基礎能力——這款旗艦模型在2026年2月推出時,就在ARC-AGI-2推理基準上達到77.1%高分,推理性能較前代提升超過兩倍,並支援高達100萬個詞元的上下文處理,能一次消化數十篇研究論文或整個程式碼庫。Gemini-SQL2正是在這樣堅實的基礎上,進一步針對SQL生成任務進行深度優化,並在BIRD的「單模型」賽道中憑藉自身推理能力登頂,展現出無需外部檢索增強或智能體框架輔助的純粹實力。

### 仍有進步空間:80%準確率不代表完美自動化

儘管Gemini-SQL2創下新高,但持平而論,這項技術距離完全取代人類數據工程師仍有相當距離。相較於人類專家在BIRD基準上92.96%的表現,Gemini-SQL2的80.04%意味著每五個查詢中仍有一個可能出錯。剩餘的錯誤類型多半源自於對模糊業務術語的誤解,或是對極端邊緣案例的處理不當。這也說明了當前文本轉SQL技術的定位應是「輔助增強」,而非「完全自動化」。特別是在金融、醫療等高風險領域,人工審查機制仍然是不可或缺的安全防線。換句話說,Gemini-SQL2的價值在於讓數據分析師從繁重的基礎SQL撰寫工作中解放出來,將精力集中在更複雜的業務邏輯判斷與結果驗證上,而非完全取代數據專業人員的判斷。

### 後續關注焦點:產品落地與技術報告何時釋出?

值得留意的是,Google目前尚未公布Gemini-SQL2的具體API介面、模型卡或技術報告,也未確認哪些產品將會率先導入這項技術。從Google在X平台上的官方說法來看,該公司提到「改善SQL理解能力可提升Google數據服務中的自然語言功能」,暗示BigQuery Studio、AlloyDB AI及Cloud SQL Studio很可能會是第一批整合對象。後續值得讀者關注的重點包括:Google何時發布正式的技術論文、Gemini-SQL2是否會以API形式開放給第三方開發者使用,以及這項技術將以何種方式導入Google Cloud的企業服務中。隨著文本轉SQL技術的不斷演進,未來我們很可能見證企業數據分析工作流程的根本性變革——當資料庫查詢變得像對話一樣自然,數據的價值將不再被技術門檻所束縛,真正回歸到洞察與決策本身。

Related

相關文章

“Token”必須死?

36氪 這篇消息聚焦「“Token”必須死?」。原摘要指出:語言模型的“思考”不必逐字發生。這則內容已被收錄為 AI 情報追蹤項目,後續可從技術進展、產品落地、產業競爭或市場影響等角度持續觀察。

3 週前