本篇文章更新時間:2026/01/27
如有資訊過時或語誤之處,歡迎使用 Contact 功能通知。
一介資男的 LINE 社群開站囉!歡迎入群聊聊~
如果本站內容對你有幫助,歡迎使用 BFX Pay 加密貨幣 或 新台幣 贊助支持。
瀏覽器:我們早就擁有的超級沙盒(讀後筆記)
編輯前言:這篇文章來自 Simon Willison 的《the browser is the sandbox》,他從 Paul Kinlan 的研究出發,重新檢視一個有趣的問題:在 AI 代理人(coding agents)時代,瀏覽器本身是否已經是最佳的運行沙盒?如果可以,那麼我們其實不需要動輒數 GB 的本地容器,也能擁有安全隔離的 AI 自動化能力。
核心觀點(Key Takeaways)
- 瀏覽器經過 30 年演進,其實已經是一個專為執行「惡意與不受信任程式碼」設計的成熟沙盒。
- 三大沙盒要素——檔案系統、網路權限、安全執行環境——瀏覽器都已有對應技術可用。
- Paul Kinlan 的 Co‑do 展示了一個 Cowork 風格的 AI 編輯器原型,完全運行於瀏覽器、無需本地容器。
深入解析
Simon 以 Paul Kinlan 的觀察為主軸:既然瀏覽器本來就為了「安全執行陌生 JavaScript」而打造,那麼在 AI agent 盛行的今天,是否能把瀏覽器視為現成的沙盒架構?Paul 的結論偏向肯定,並以 Co‑do 這個 demo 做驗證。
他整理了三大沙盒能力在瀏覽器中的對應技術:
- 檔案系統:利用 File System Access API。雖然目前主要支援 Chrome,但已能提供可控、沙盒化的檔案操作能力。
- 網路存取安全:透過 CSP(Content Security Policy)搭配
,可對網路請求設定細緻的限制。Paul 尤其深入解析了跨瀏覽器不一致的行為,甚至介紹了「雙層 iframe 技巧」來規避限制、強化隔離。 - 程式碼安全執行:使用 WebAssembly 與 Web Workers 提供隔離、非主執行緒、可控效能的運行環境。
Paul 的 Co‑do 便整合這些想法:使用者選擇目錄、設定 LLM provider 和 API key,Co‑do 就能在瀏覽器內與 LLM 互動、讀取目錄(僅限讀取)並提供類似 Claude Cowork 的工作流程,不需額外安裝或容器。
Simon 在文章中還分享了他因而學到的新能力:
居然在 Firefox、Safari、Chrome 都能運作,而且允許瀏覽器一次讀取整個資料夾(唯讀)。
這種設計讓他決定未來在更多專案中使用它。
- 瀏覽器作為行動基地:作者指出,這些能力讓 Co‑do 的原型證明了一件事——只靠瀏覽器,其實就能提供一個夠安全又夠實用的 AI 代理人工作環境。
- 標準與文件缺口依舊存在:尤其是
的跨瀏覽器差異仍然是最大痛點,文中也明示其「文件稀薄」問題。
筆者心得與啟發
讀完這篇文章,我最深的感觸是:AI agents 的崛起,似乎正在重新定義「執行環境」的想像。以往我們認為跑 agent 必須要 Docker 這種重量級沙盒,但瀏覽器多年累積的安全工學,可能早已提供一個更輕量、更普及的選擇。
我特別認同這個方向的意義:
- 降低使用門檻:如果 Co‑do 這類應用能普及,未來的人可能只需要打開網址,就能擁有一個完整的 AI 工作站。
- 提升安全隔離品質:瀏覽器的 CSP 和 sandbox 屬性其實遠比一般開發者想像的強大,甚至能精準限制 agent 的「可觸及世界」。
- 跨平台天生具備:不需安裝、不需權限、不需容器,瀏覽器就是 runtime。
這讓我重新思考:AI agents 的落地,也許不該只依賴雲端或本機 VM。瀏覽器可能會是下一個 agent 平台,而且是最容易普及的那一種。
我甚至開始期待:是否會出現「browser‑first agents」的開發框架?
如果真的如此,AI 工具的使用方式可能會被徹底改寫。
