如何在 Chrome 擴充功能中使用 Transformers.js

2026年4月23日 00:00

重點摘要

Hugging Face 官方部落格發布了一份實戰指南，詳細說明如何在 Chrome 擴充功能（Manifest V3）中利用 Transformers.js 執行本地端 AI 模型。該架構將背景服務工作者、側邊面板與內容腳本分離，由背景腳本統一負責模型推理與訊息協調，並採用文字生成與向量嵌入雙模型分工，以提升效率。這項技術讓開發者能在本地端完成推理，無需依賴雲端 API，從而強化隱私保護與離線可用性。

站內 AI 整理稿

隨著瀏覽器擴充功能的功能日益強大，將機器學習模型直接帶入客戶端已成為開發趨勢。Transformers.js 讓開發者能在瀏覽器中執行 Hugging Face 上的模型，而 Chrome 擴充功能則是絕佳的應用場景。最近 Hugging Face 官方部落格分享了一份實戰指南，說明如何在 Manifest V3 的限制下，利用 Transformers.js 打造具備本地 AI 能力的 Chrome 擴充功能。這份指南不僅展示了技術架構，更提供許多實務觀察，值得台灣的開發者與 AI 應用愛好者參考。

### 架構總覽：三個運行環境各司其職

在 Manifest V3 的規範下，擴充功能主要由三個進入點組成：背景服務工作者（background service worker）、側邊面板（side panel）以及內容腳本（content script）。背景腳本扮演「控制中樞」的角色，負責管理模型生命週期、代理邏輯與工具執行，所有耗費資源的推理工作都在這裡完成。側邊面板則作為使用者互動層，負責聊天輸入輸出與串流更新，保持輕量化。內容腳本則像一座「頁面橋樑」，專注於 DOM 提取與元素突顯等頁面級操作。這樣的職責分離，不僅能避免模型重複載入，也能確保 UI 反應迅速，同時遵守 Chrome 對 DOM 存取的資安邊界。

### 訊息傳遞：單一協調者模式是關鍵

由於三個運行環境彼此隔離，標準化的訊息溝通便成為整座架構的骨幹。這份指南建議開發者透過列舉型別（enum）定義所有訊息類型，並讓背景腳本擔任唯一的協調者。例如側邊面板發送「AGENT_GENERATE_TEXT」事件，背景腳本收到後立即附加到對話記錄、執行推理，再發出「MESSAGES_UPDATE」事件讓側邊面板重新渲染。同樣地，內容腳本也僅透過背景腳本接收「EXTRACT_PAGE_DATA」或「HIGHLIGHT_ELEMENTS」等指令。這種單向、統一的訊息流，大幅降低除錯難度，也讓擴充功能更容易維護。

### 模型整合細節：雙模型分工提升效率

在模型選擇上，該擴充功能使用兩個不同角色的模型：文字生成採用 Gemma 4（E2B 版本的 ONNX 量化模型，位元率 q4f16），負責推理與工具決策；向量嵌入則使用輕量級的 all-MiniLM-L6-v2（FP32 格式），專門處理語義相似度搜尋（例如「詢問網站」或「尋找歷史記錄」功能）。所有推理都集中在背景腳本執行，這樣的好處是：所有分頁與工作階段共享同一組模型實例，不僅節省記憶體，也能利用 Transformers.js 最新提供的 DynamicCache 類別實現一致的 KV 快取，進而加速生成速度。

### 實際開發觀察：回應性與記憶體管理的權衡

在實作過程中，開發者特別提到幾個值得注意的面向。首先，Manifest V3 的服務工作者在閒置時可能被瀏覽器終止，因此模型載入與快取策略必須考慮重新初始化成本。其次，由於大型語言模型在客戶端佔用不少記憶體，選擇適當的量化格式（如 q4f16）以及只在必要時加載模型，是維持瀏覽器流暢的關鍵。此外，對話歷史儲存在背景腳本的記憶體中，而非傳送到側邊面板儲存，這樣能避免資料不一致，也讓串流更新更自然。

### 可能影響：本地 AI 擴充功能的新標準

這份指南的推出，對 Chrome 擴充功能開發社群具有指標意義。過去要在擴充功能中整合 AI，多半依賴雲端 API，但 Transformers.js 搭配 Manifest V3 的架構，讓開發者能完全在本地端執行推理，達成更好的隱私保護與離線可用性。對於台灣的開發者而言，這意味著可以設計出更多不依賴後端伺服器的智慧工具，例如即時網頁摘要、自訂搜尋助手

原始來源：Hugging Face Blog ↗

查看原始來源

鈦媒體AI工具與產品

Token成本算盤打響，Seedance開始駛向“五環外”

這篇消息聚焦「Token成本算盤打響，Seedance開始駛向“五環外”」。原始導語提到：視頻AI的決勝場，不在模型本身。從 AI 情報角度來看，這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

剛剛閱讀分析

IT之家AI工具與產品

Pixel 10 手機用戶反饋谷歌 AI“搶鏡”問題，Gmail 無法正常回復郵件

科技媒體 Android Authority 昨日（6 月 18 日）發佈博文，報道稱 Pixel 10 系列手機遭遇 AI“搶鏡”問題，用戶在 Gmail 回覆郵件時無法彈出輸入法鍵盤，優先顯示 Help me write 功能。

2 小時前閱讀分析

IT之家AI工具與產品

DeepSeek 識圖模式正式上線 App 和網頁端

DeepSeek 多模態研究員 Xiaokang Chen 今日表示，DeepSeek 的識圖模式已在網頁和 App 端正式上線。IT之家測試，目前 DeepSeek 的 App 端識圖模式依然提示“圖片理解功能內測中”，網頁端沒有這項提示。

20 小時前閱讀分析

IT之家AI工具與產品

微信、豆包之後，消息稱阿里將推“千問輸入法”

千問團隊將推出名為“千問輸入法”的獨立 App，與 PC 端的千問語音輸入法有一定區別，AI 功能、鍵盤會更貼合手機端操作，填補千問在移動端 AI 輸入法賽道的空白，產品已開發完成，擇日上線各大應用商店。

1 天前閱讀分析

AIBaseAI工具與產品

Kimi Work 迎重大升級：推出“目標模式”並打通外部應用插件

月之暗面旗下 Kimi 電腦客戶端近日煥新升級，為 Kimi Work（Beta 版）引入兩項重磅新特性：目標模式實現連續自主工作 24 小時，插件中心正式對接多家主流辦公軟件，提升工作流效率。為加速用戶深度體驗，官方同步推出限時優惠，2026 年 6 月全月，使用 Work 模式的會員額度消耗直接打 5 折，帶來實惠。

1 天前8300閱讀分析

AIBaseAI工具與產品

網易雲音樂旗下AI情感陪伴App“妙時”宣佈7月14日停運

網易雲音樂旗下“妙時”（含AI奇遇）AI情感陪伴應用發佈停運公告，將於7月14日0時全面停止服務。客服迴應屬正常業務調整，不影響其他產品。目前已停止新用戶註冊和充值，用戶可在8月14日前申請退還剩餘代幣和會員費，並導出AI戀人聊天記錄。

1 天前9400閱讀分析

相關文章

Token成本算盤打響，Seedance開始駛向“五環外”

Pixel 10 手機用戶反饋谷歌 AI“搶鏡”問題，Gmail 無法正常回復郵件

DeepSeek 識圖模式正式上線 App 和網頁端

微信、豆包之後，消息稱阿里將推“千問輸入法”

Kimi Work 迎重大升級：推出“目標模式”並打通外部應用插件

網易雲音樂旗下AI情感陪伴App“妙時”宣佈7月14日停運