Agent Safehouse：打造 AI 代理的 macOS 最小權限沙盒

Chun 2026/03/092026/06/14 發佈留言

本篇文章更新時間：2026/06/14
如有資訊過時或語誤之處，歡迎使用 Contact 功能通知或向一介資男的 LINE 社群反應。
如果本站內容對你有幫助，歡迎贊助支持。

內容目錄

1 Agent Safehouse：為什麼我開始在本機跑 AI 時更安心了

Agent Safehouse：為什麼我開始在本機跑 AI 時更安心了

編輯前言：隨著越來越多人在本機使用 Claude、Gemini 或各種自主 Agent，"給 AI 本機權限會不會有風險？" 已經成了我自己最常收到的問題之一。這篇文章從 Agent Safehouse 出發，重新整理了如何用 macOS 原生 sandbox 給 AI 一個安全的活動空間。

核心觀點 (Key Takeaways)

LLM 是機率系統，只要有 1% 出錯的機率，就一定會出錯；本地 Agent 需要正式的 sandbox。
Safehouse 採用 deny-first 模型，和 macOS 原生機制，用戶所有權限都不會直接繼承給 Agent。
透過一個 shell script 就能啟動安全環境，操作方式接近透明，無須額外建構流程。

深入解析

原文開宗明義地提醒：LLM 只要有「1% 會犯錯」的可能，就等於遲早會出錯。 像是常見的指令誤判、錯刪檔案、錯讀機密資料等，尤其在本機執行 Agent 時更需要小心。Safehouse 的核心，就是把這個風險降到最低。

原文提到：「Agents inherit your full user permissions. Safehouse flips this — nothing is accessible unless explicitly granted.」

這個翻轉其實是關鍵。多數代理工具會直接繼承你的系統權限，但 Safehouse 把它反過來：預設全部禁止，只有你授權的專案資料夾可以讀寫，工具鏈可讀，但像 SSH key、其他 repo、dotfiles 等都完全不可見。

最小權限的本地沙盒
Safehouse 透過 macOS 的原生 sandbox-exec 實作，這點很值得注意，因為它不需要額外安裝 Kext 或額外 runtime。只要下載一個 shell script 就能運作。
安全性可被驗證，而不是感覺
作者甚至示範了直接在沙盒中讀取 ~/.ssh/id_ed25519，結果是 kernel 在 Agent 前就阻擋了。
對我來說，這比文件宣稱安全還更實在。
啟動成本極低，開發不受干擾
Safehouse 會自動給目前工作目錄（Git root）讀寫權限，這意味著你可以無痛在專案裡讓 Agent 做事，但它沒辦法碰到其他位置。

另外，作者還提供了 shell function，讓所有 Agent 指令預設都在 sandbox 裡執行，只有用 command 前綴時才跳過，這讓安全成為「預設值」。

筆者心得與啟發

老實說，過去我也常用本地 Agent 幫忙 refactor、查錯、跑腳本，但心裡多少會有點不安。尤其是越來越多 Agent 有自主「檔案編輯、指令執行」能力，一旦誤判就可能造成難以挽回的損失。

Safehouse 的出現讓我覺得：本地 AI 的安全標準終於往前推了一大步。

我特別喜歡它的三個設計哲學：

安全是預設，而不是依賴人類記得設定
最小權限模型，而不是最大權限後再逐一封鎖
可用、簡單、透明，不會破壞開發流程

如果你也在本機跑 Agent，或你的團隊開始大量實驗自主 AI，我強烈建議把 Safehouse 納入日常開發流程。尤其是當你的機器裡有敏感金鑰、私有 repo、未發布的產品程式碼，這些東西的保護比方便更重要。

我自己的下一步，會是用原文提供的 prompt 讓 LLM 為我生成客製化的 sandbox profile，把權限再調整得更精準，讓本地 Agent 真正「只知道它該知道的」。

作者: Chun

WordPress 社群貢獻者、開源社群推廣者。專注於 WordPress 外掛開發、網站效能最佳化、伺服器管理，以及 iDempiere 開源 ERP 導入與客製開發。曾參與 WordCamp Taipei 等社群活動，GitHub Arctic Code Vault Contributor。提供資訊顧問、WordPress 開發教學、主機最佳化與企業 ERP 整合服務。

發佈留言

取消回覆

文章

文章