最近做了个 OpenClaw 的安全插件,叫 SecurityClaw 。
主要是因为我自己越来越觉得:
AI Agent 一旦开始有文件读写、命令执行、插件调用这些能力,风险模型就和普通对话型 AI 完全不一样了。
但很多本地 Agent 工具在安全这块还比较早期。
能力发展很快,边界、审计、审批这些机制相对落后。
现在主流的安全策略还是依赖 prompt 约束,这很依赖模型遵循指令的能力。
所以我做了个插件,想让 OpenClaw 更安全一些。
现在大概支持这些功能:
• 运行时拦截高危工具调用
• 高风险操作审批
• 敏感信息检测和脱敏
• OpenClaw 配置安全检查,一键修复
• 插件 / skill 风险分析
• 事件审计和 dashboard
开源仓库在这里:
https://github.com/znary/securityclaw
这东西还在继续打磨,不过我比较想听真实使用场景下的反馈,而不是闭门造车。
比较关心几个问题:
• 如果 Agent 跑在你的主力机器上,你最在意的风险点是什么?
• 你会希望哪些操作默认被拦住?
• 你觉得“审批”这件事在日常使用里会不会太打断体验?
如果大家有想法,欢迎拍砖。
主要是因为我自己越来越觉得:
AI Agent 一旦开始有文件读写、命令执行、插件调用这些能力,风险模型就和普通对话型 AI 完全不一样了。
但很多本地 Agent 工具在安全这块还比较早期。
能力发展很快,边界、审计、审批这些机制相对落后。
现在主流的安全策略还是依赖 prompt 约束,这很依赖模型遵循指令的能力。
所以我做了个插件,想让 OpenClaw 更安全一些。
现在大概支持这些功能:
• 运行时拦截高危工具调用
• 高风险操作审批
• 敏感信息检测和脱敏
• OpenClaw 配置安全检查,一键修复
• 插件 / skill 风险分析
• 事件审计和 dashboard
开源仓库在这里:
https://github.com/znary/securityclaw
这东西还在继续打磨,不过我比较想听真实使用场景下的反馈,而不是闭门造车。
比较关心几个问题:
• 如果 Agent 跑在你的主力机器上,你最在意的风险点是什么?
• 你会希望哪些操作默认被拦住?
• 你觉得“审批”这件事在日常使用里会不会太打断体验?
如果大家有想法,欢迎拍砖。