瀏覽器其實就是最成熟的沙盒：從 Co‑do 看未來代理人運行環境的可能性

本篇文章更新時間：2026/01/27
如有資訊過時或語誤之處，歡迎使用 Contact 功能通知或向一介資男的 LINE 社群反應。
如果本站內容對你有幫助，歡迎贊助支持。

瀏覽器：我們早就擁有的超級沙盒（讀後筆記）

編輯前言：這篇文章來自 Simon Willison 的《the browser is the sandbox》，他從 Paul Kinlan 的研究出發，重新檢視一個有趣的問題：在 AI 代理人（coding agents）時代，瀏覽器本身是否已經是最佳的運行沙盒？如果可以，那麼我們其實不需要動輒數 GB 的本地容器，也能擁有安全隔離的 AI 自動化能力。

核心觀點（Key Takeaways）

瀏覽器經過 30 年演進，其實已經是一個專為執行「惡意與不受信任程式碼」設計的成熟沙盒。
三大沙盒要素——檔案系統、網路權限、安全執行環境——瀏覽器都已有對應技術可用。
Paul Kinlan 的 Co‑do 展示了一個 Cowork 風格的 AI 編輯器原型，完全運行於瀏覽器、無需本地容器。

深入解析

Simon 以 Paul Kinlan 的觀察為主軸：既然瀏覽器本來就為了「安全執行陌生 JavaScript」而打造，那麼在 AI agent 盛行的今天，是否能把瀏覽器視為現成的沙盒架構？Paul 的結論偏向肯定，並以 Co‑do 這個 demo 做驗證。

他整理了三大沙盒能力在瀏覽器中的對應技術：

檔案系統：利用 File System Access API。雖然目前主要支援 Chrome，但已能提供可控、沙盒化的檔案操作能力。
網路存取安全：透過 CSP（Content Security Policy）搭配 <iframe sandbox>，可對網路請求設定細緻的限制。Paul 尤其深入解析了跨瀏覽器不一致的行為，甚至介紹了「雙層 iframe 技巧」來規避限制、強化隔離。
程式碼安全執行：使用 WebAssembly 與 Web Workers 提供隔離、非主執行緒、可控效能的運行環境。

Paul 的 Co‑do 便整合這些想法：使用者選擇目錄、設定 LLM provider 和 API key，Co‑do 就能在瀏覽器內與 LLM 互動、讀取目錄（僅限讀取）並提供類似 Claude Cowork 的工作流程，不需額外安裝或容器。

Simon 在文章中還分享了他因而學到的新能力：

<input type="file" webkitdirectory> 居然在 Firefox、Safari、Chrome 都能運作，而且允許瀏覽器一次讀取整個資料夾（唯讀）。

這種設計讓他決定未來在更多專案中使用它。

瀏覽器作為行動基地：作者指出，這些能力讓 Co‑do 的原型證明了一件事——只靠瀏覽器，其實就能提供一個夠安全又夠實用的 AI 代理人工作環境。
標準與文件缺口依舊存在：尤其是 <iframe sandbox> 的跨瀏覽器差異仍然是最大痛點，文中也明示其「文件稀薄」問題。

筆者心得與啟發

讀完這篇文章，我最深的感觸是：AI agents 的崛起，似乎正在重新定義「執行環境」的想像。以往我們認為跑 agent 必須要 Docker 這種重量級沙盒，但瀏覽器多年累積的安全工學，可能早已提供一個更輕量、更普及的選擇。

我特別認同這個方向的意義：

降低使用門檻：如果 Co‑do 這類應用能普及，未來的人可能只需要打開網址，就能擁有一個完整的 AI 工作站。
提升安全隔離品質：瀏覽器的 CSP 和 sandbox 屬性其實遠比一般開發者想像的強大，甚至能精準限制 agent 的「可觸及世界」。
跨平台天生具備：不需安裝、不需權限、不需容器，瀏覽器就是 runtime。

這讓我重新思考：AI agents 的落地，也許不該只依賴雲端或本機 VM。瀏覽器可能會是下一個 agent 平台，而且是最容易普及的那一種。

我甚至開始期待：是否會出現「browser‑first agents」的開發框架？

如果真的如此，AI 工具的使用方式可能會被徹底改寫。

作者: Chun

WordPress 社群貢獻者、開源社群推廣者。專注於 WordPress 外掛開發、網站效能最佳化、伺服器管理，以及 iDempiere 開源 ERP 導入與客製開發。曾參與 WordCamp Taipei 等社群活動，GitHub Arctic Code Vault Contributor。提供資訊顧問、WordPress 開發教學、主機最佳化與企業 ERP 整合服務。

發佈留言

取消回覆

文章

文章