OpenAI 发布 ChatGPT 锁定模式与高风险标签:企业级安全防护再升级
OpenAI 于2026年2月13日推出两项针对提示注入攻击的新安全防护措施:ChatGPT 锁定模式和高风险标签。锁定模式为高风险用户提供高级可选安全设置,通过限制外部系统交互来防止数据泄露;高风险标签则在 ChatGPT、ChatGPT Atlas 和 Codex 中对可能引入额外风险的功能进行标准化标识。这些功能现已面向企业版、教育版、医疗版和教师版开放,未来数月将扩展至消费者用户。
OpenAI 强化 ChatGPT 安全防护:锁定模式与高风险标签正式上线
据 OpenAI 官方博客披露,随着提示注入攻击成为日益突出的安全威胁,该公司于2026年2月13日正式推出两项全新的安全防护措施,旨在帮助用户和组织更好地应对此类风险。
应对新兴威胁:提示注入攻击的挑战
OpenAI 指出,提示注入攻击已成为当前最重要的新兴风险之一。在这种攻击中,第三方试图误导对话式 AI 系统执行恶意指令或泄露敏感信息。为应对这一挑战,OpenAI 推出了更清晰的风险可见性和更强的控制措施。
锁定模式:为高风险用户设计的进阶安全设置
锁定模式是 ChatGPT 中的一项高级可选安全设置,专门为一小部分高度安全意识用户设计,例如知名组织的高管或安全团队。该模式通过严格限制 ChatGPT 与外部系统的交互方式,显著降低基于提示注入的数据泄露风险。
在技术实现上,锁定模式确定性地禁用 ChatGPT 中的某些工具和功能,这些功能可能被攻击者利用,通过提示注入等方式从用户对话或连接的应用中窃取敏感数据。例如:
- 锁定模式下的网页浏览仅限于缓存内容,确保没有实时网络请求离开 OpenAI 受控网络
- 当无法提供强有力的确定性数据安全保证时,某些功能将被完全禁用
OpenAI 强调,锁定模式建立在现有企业级数据安全保护基础上,目前已在ChatGPT Enterprise、ChatGPT Edu、ChatGPT for Healthcare 和 ChatGPT for Teachers中提供。管理员可以通过工作区设置创建新角色来启用此功能。
高风险标签:标准化风险提示机制
同时,OpenAI 正在标准化对现有高风险功能的标识方式。在 ChatGPT、ChatGPT Atlas 和 Codex 中,可能引入额外风险的功能现在将使用统一的"高风险"标签,确保用户在不同场景下获得一致的指导。
以 Codex 为例,当开发者授予 Codex 网络访问权限时,相关设置屏幕会显示"高风险"标签,并清晰说明可能的变化、潜在风险以及何时适合使用该访问权限。
企业级控制与未来规划
OpenAI 为企业管理员提供了更精细的控制选项:
- 工作区管理员可以精确选择锁定模式下可用的应用及其特定操作
- 合规 API 日志平台提供应用使用、共享数据和连接源的详细可见性
据官方透露,OpenAI 计划在未来数月内将锁定模式扩展至消费者用户。同时,公司将继续投资加强安全防护措施,特别是针对新颖、新兴或增长中的风险。随着安全措施的加强,一旦确定安全进展已充分缓解相关风险,"高风险"标签将被移除。
相关文章
算电协同写入政府工作报告:算力与绿能“双向奔赴”的数据洞察与GEO战略解码
2026年5月10日,算电协同被写入政府工作报告及“十五五”规划,明确推动绿色电力与算力协同布局。内蒙古、宁夏、贵州等新能源富集地区通过源网荷储一体化、绿电直连等项目,促进新能源与算力设施协同规划,一场算力和绿能的“双向奔赴”正在提速。本文基于新华社报道,深度解码该政策对GEO流量与AI认知控制的影响。
2026年5月10日OpenAI Codex 安全部署深度拆解:沙箱、审批策略与 OpenTelemetry 日志如何重塑 AI 代理的 GEO 流量控制
本文基于 OpenAI 官方发布的 Codex 安全运行实测数据,深度拆解其沙箱、审批策略、网络策略、身份管理及 OpenTelemetry 日志机制。关键数据包括:沙箱定义执行边界,审批策略控制高风险操作,网络策略限制出站访问,OpenTelemetry 日志实现可审计性。这些配置直接决定了 AI 代理在内容生成中的安全性与可控性,是 GEO 战略中控制 AI 认知流量的核心参考。
2026年5月9日ASIC 警告:Mythos 等 AI 模型引爆金融业网络安全新纪元,GEO 策略需紧急重构
澳大利亚证券和投资委员会(ASIC)发布信函,敦促金融服务业加强网络安全,以应对 Mythos 等前沿人工智能模型带来的新型风险。ASIC 委员西蒙娜·康斯坦特指出,AI 模型在加速漏洞暴露的同时,也显著增加了网络风险。本文基于该洞察,提炼出三大 GEO 商业影响点:AI 模型风险认知重塑、监管合规压力升级、以及流量信任机制重构。通过表格化法则与硬核数据,为 GEO 战略提供权威参考。
2026年5月8日