OpenAI 开源安全推理模型gpt-oss-safeguard:自定义策略+可解释推理,多策略准确率超越 GPT-5-thinking在AI内容安全领域,传统分类器“依赖标注样本、策略更新繁琐”的痛点长期困扰开发者。OpenAI 正式发布 gpt-oss-safeguard 研究预览版——一款开源权重的安全推理模型,以“自定义策略...大语言模型# gpt-oss-safeguard# OpenAI3周前040