OpenAI 推出试点计划，为网络安全提供对其最强大 AI 工具的受控访问

想象一种具有巨大潜力的技术，能够修复易受攻击的系统，但如果落入错误之人手中，也能加以利用。🛡️ OpenAI 推出了 Trusted Access for Cyber，这是一个试点倡议，旨在精确管理这种力量，将其最先进的 AI 模型专供经过验证的数字安全专家使用。

核心策略不是向大众释放这些能力。相反，建立了一个严格的选拔流程，类似于高级访问过滤器。希望参与的实体必须 证明其合法性 并通过全面的身份验证。只有通过此审查的团队才能使用 AI 来 检测漏洞、设计修复 或 分析恶意代码，从而加速保护而不武装对手。

可信访问计划的支柱：

这是一个关键实验，用以验证我们是否能将特殊能力仅授予守护者，避免手册落入错误之人手中。

该方法的一个关键方面是将 内置缓解措施 直接集成到 AI 模型中。这些措施充当 自我控制的本能，使系统自动拒绝其识别为有害的请求。同时，OpenAI 分配 1000 万美元信贷，以便保护开源软件或关键基础设施的实体免费使用这些工具，旨在倾斜天平以利于全球保护。

控制和支持机制：

这一倡议代表了管理强大 AI 相关风险的重要一步。通过优先考虑 受控和审计的访问，旨在最大化对集体安全的益处，同时最小化滥用潜力。在当今数字景观中，最强大的防御可能恰恰依赖于良好的... 监督访问。🔒