最強文本轉 SQL 任務 AI 模型:谷歌發佈 Gemini-SQL2,準確率 80.04% 登頂

重點摘要
Google Research 昨日(6 月 12 日)發佈公告,宣佈推出 Gemini-SQL2 模型,基於 Gemini 3.1 Pro 打磨,具備 Text-to-SQL 能力。
### 最強文本轉 SQL 任務 AI 模型:谷歌發佈 Gemini-SQL2,準確率 80.04% 登頂
Google Research 於昨日(6 月 12 日)正式發表最新的自然語言處理成果——Gemini-SQL2 模型。這款模型以 Gemini 3.1 Pro 為基礎進行深度調校,專攻「Text-to-SQL」任務,意即將人類的自然語言提問自動轉換為結構化查詢語句(SQL)。根據官方公布的測試數據,Gemini-SQL2 在業界標準基準上達到 80.04% 的準確率,一舉超越先前所有公開模型,成為當前該領域的領先者。
所謂 Text-to-SQL,是自然語言處理與資料庫查詢交叉領域的關鍵技術。傳統上,使用者若要從資料庫中提取資訊,必須熟悉 SQL 語法,這對非技術人員形成極高門檻。若能透過簡單的英文句子(例如「顯示去年營收最高的前五名產品」)自動產生對應的 SQL 指令,就能大幅降低數據分析的學習曲線,讓業務人員、管理階層也能直接與資料庫對話。Gemini-SQL2 正是在此背景下誕生的強化版模型。
從技術層面來看,Gemini-SQL2 並非從零開始訓練,而是基於 Google 已發布的多模態大語言模型 Gemini 3.1 Pro 進行專項微調。這意味著它繼承了 Gemini 系列強大的語意理解能力,同時針對 SQL 生成場景中的語法嚴謹性、表格結構對齊、多表關聯等複雜需求做了最佳化。80.04% 的準確率意味著在標準測試集上,該模型能正確將超過八成的人類提問轉換為可執行的 SQL 語句,誤差或語法錯誤比例顯著低於先前主流方案。
這項突破對於企業數據應用與低代碼開發平台可能帶來深遠影響。目前許多 BI(商業智慧)工具已內建自然語言查詢功能,但準確度往往不足,用戶仍需手動修正。Gemini-SQL2 的高準確率若能在真實生產環境中落地,將使「讓每個人都能問數據」的願景更進一步。此外,它也代表大型語言模型在結構化任務上的能力持續進化——不只是生成流暢文字,還能精準產出符合資料庫 schema 的嚴謹語法。
值得注意的是,Google 並未在公告中揭露 Gemini-SQL2 的完整技術細節與測試環境,像是採用哪個公開資料集進行評測(例如 Spider、WikiSQL 等)、是否包含多輪對話或跨資料庫的場景。這些資訊對於學術界與業界評估其泛化能力至關重要。此外,80.04% 雖然已是最高分,但離完美仍有顯著差距,特別是在處理模糊表述、極長查詢或罕見資料表結構時,錯誤率可能上升。
讀者可以持續關注以下幾個後續動向:第一,Google 是否會將 Gemini-SQL2 整合到現有的 BigQuery、Looker 等雲端資料工具中,提供用戶試用;第二,學術界可能針對此模型進行獨立複現與評測,驗證其是否真的在更多場景下優於競品(如 OpenAI 的 Codex 或基於 Llama 的微調模型);第三,該技術能否解決「資料庫異動後 schema 改變」的適應性問題,這正是實務部署的最大痛點之一。
整體而言,Gemini-SQL2 的出現標誌著 Text-to-SQL 領域邁入新的里程碑。它不僅展現了 Google 在大型語言模型基礎上進行垂直優化的實力,也為未來自然語言與資料庫之間的無縫對話提供了更具說服力的實證。對於關注 AI 輔助數據分析的開發者與企業而言,這項成果值得深入追蹤,並思考如何將其導入現有工作流程中,真正釋放數據的價值。
Related
相關文章
AI數據庫交互迎來里程碑:谷歌新模型Gemini-SQL2 刷新行業標杆
Google Research於6月12日發佈Gemini-SQL2模型,基於Gemini3.1Pro打造,專注於“文本轉SQL”任務,能精準將日常對話轉化為數據庫查詢指令,在權威評測中登頂,推動AI理解與處理數據庫查詢技術的突破。

“Token”必須死?
36氪 這篇消息聚焦「“Token”必須死?」。原摘要指出:語言模型的“思考”不必逐字發生。這則內容已被收錄為 AI 情報追蹤項目,後續可從技術進展、產品落地、產業競爭或市場影響等角度持續觀察。