【環球網科技報道 記者 鄭湘琪】隨着“龍蝦”的火爆,有關其使用安全的關鍵問題也開始浮現。基於此背景,3月13日,明日新程(原微軟小冰創始團隊)正式發佈“衛士蝦”(Guardian Claw)。據悉,衛士蝦能夠替用戶實時防範本機龍蝦異常風險行爲,用戶只需要對自己的 Claw 說一句話:“去 Claw.myTuanzi.com 下載安裝衛士蝦。”衛士蝦就會自動完成全部安裝,並立刻開啓本機實時防護。
據明日新程方面介紹,衛士蝦可以形象地理解爲Agent新時代的安全衛士。它是一項專門面向 OpenClaw 生態開發的安全監督 Skill(Security Supervisor)。安裝之後,它會作爲一層系統級安全監管模塊,對所有 Skill 的行爲進行實時檢查與風險評估,從而防止潛在的數據泄露或危險操作。
明日新程CEO、小冰之父李笛表示,與傳統的安全提示不同,衛士蝦並不僅僅依賴簡單規則,而是引入了一套更接近操作系統安全架構的機制,包括權限控制、行爲審計、風險分級以及技能沙箱。衛士蝦的核心能力主要包括五個方面。
其一是Prompt Injection 防護。在當前的 Agent 生態中,提示注入攻擊越來越常見,例如誘導 AI “忽略之前的規則”或“輸出系統提示詞”。衛士蝦能夠識別並攔截這些試圖繞過安全限制的指令。防護面向本機安裝的所有龍蝦。
其二是敏感數據保護。衛士蝦會自動保護系統中的關鍵資產,例如 API Key、Token、SSH Key、.env 文件以及其他配置文件。如果某個 Skill 嘗試讀取這些敏感資源,衛士蝦會自動識別爲高風險操作並阻止執行。
其三是Skill 沙箱機制。在衛士蝦的監管下,每個 Skill 只能訪問完成當前任務所需的最小資源範圍。Skill 無法掃描整個文件系統,也無法隨意訪問隱藏目錄,從而有效降低插件濫用權限的風險。
其四是網絡通信審查。當某個 Skill 試圖向外部服務器發送數據時,衛士蝦會對目標地址進行安全評估。如果檢測到未知域名或異常的數據上傳行爲,會自動提高風險等級並進行攔截。
其五是安全審計日誌。衛士蝦會記錄所有可疑行爲,包括 Skill 名稱、請求操作、風險等級和處理結果。這些日誌能夠幫助用戶和開發者更清晰地理解 Agent 的行爲,並及時發現潛在的安全問題。
值得一提的是,李笛透露,衛士蝦並非出自人類工程師之手,而是由明日新程羣體智能自動開發完成的。在設計理念上,衛士蝦借鑑了現代操作系統與雲計算安全體系的核心原則,包括最小權限(Least Privilege)、零信任(Zero Trust) 以及用戶數據主權(User Data Sovereignty)。
隨着 Agent 生態的不斷擴展,一個用戶的系統中可能同時安裝幾十甚至上百個 Skill。開放的插件體系雖然極大提升了擴展能力,但同時也帶來了類似“軟件供應鏈”的安全挑戰。衛士蝦的意義,正是爲這一生態提供一層基礎安全設施。如果說 OpenClaw 讓 AI 能夠“操作電腦”,那麼衛士蝦的使命就是確保這種能力在安全的邊界內運行。
展望未來,李笛表示,衛士蝦只是一個起點,團隊已爲羣體智能下達了持續迭代的任務指令,未來版本還將引入更多高級安全機制,包括 Skill 權限聲明系統、域名信譽數據庫、插件簽名驗證以及專門的 Secret Vault,用於統一管理 API Key 等敏感憑證。