JoySafety

2个月前发布 134 00

京东正式开源大模型安全框架——JoySafety,该框架在京东内部广泛应用,覆盖AI导购、物流客服、销售助手、医疗问诊、商家工作台、法务咨询、安全问答等场景,支持日均亿级调用、95%+攻击拦截率,致力于为企业提供一套成熟、可靠、免费的大模型安全防护方案。

所在地:
中国
收录时间:
2025-09-29
JoySafetyJoySafety

随着生成式AI在企业场景中的广泛应用,内容安全、提示词注入、数据泄露等风险日益突出。如何确保大模型输出合规、稳定且可管控,已成为AI落地的关键挑战。

JoySafety

为此,京东正式开源其内部广泛使用的大模型安全框架——JoySafety。该框架已在京东多个核心业务中长期运行,覆盖AI导购、物流客服、销售助手、医疗问诊、商家工作台、法务咨询、安全问答等高敏感场景,日均调用量达亿级规模,攻击拦截率超过95%

JoySafety 致力于为企业提供一套成熟、可靠、免费、可自托管的大模型安全解决方案,助力构建安全可控的AI应用体系。

核心特性

✅ 生产级别:企业实战验证

JoySafety 并非实验性工具,而是经过复杂业务环境长期打磨的企业级安全中间件。

  • 真实场景验证:已在京东多个生产系统中稳定运行,支撑高并发、低延迟的线上服务
  • 高可用架构:支持横向扩展,满足大规模部署需求
  • 零门槛接入:提供标准化接口,业务方无需改造即可快速集成
  • 分钟级策略更新:安全规则变更支持热更新,无需重启服务,快速响应新型攻击

🔄 高可靠性:保障业务连续性

安全不应以牺牲可用性为代价。JoySafety 在设计上充分考虑了对业务的影响:

  • 原子能力热插拔:单个检测模块升级或故障时,不影响整体服务链路
  • 配置动态生效:策略调整实时推送,无需重启进程
  • 长期稳定性验证:在京东内部持续迭代优化,经受住大促流量考验

📈 高扩展性:灵活适配不同需求

灵活的架构设计

JoySafety 采用模块化设计,具备极强的可扩展性:

特性说明
多模型支持兼容 BERT、FastText、Transformer 等主流文本检测模型
标准化接口所有“原子能力”通过统一接口接入,便于新增算法模块
部署模式灵活支持独立部署(边缘节点)或集中式集群部署
轻量编排引擎基于 DAG 的流程编排,按需组合检测策略

智能负载均衡

  • 集群化部署:支持水平扩展,应对高并发请求
  • 异步检测机制:采用 Free-Taxi 异步输出模式,在保证安全性的同时降低响应延迟
  • 窗口化检测策略:结合上下文进行多轮会话分析,平衡性能与准确率

💡 易用性:开箱即用,快速集成

JoySafety 注重开发者体验,力求降低使用门槛:

  • 一键启动:提供 docker-compose.yml 配置,本地环境零配置即可运行
  • DAG 可视化编排:支持图形化定义检测流程,灵活定制策略链
  • 标准 API 接口:RESTful 设计,轻松对接现有 AI 系统或网关层

核心技术亮点

1. 多轮会话智能识别

传统内容过滤多基于单条输入判断,易被绕过。JoySafety 支持对完整对话历史进行上下文感知分析,有效识别渐进式诱导、角色扮演等高级攻击手法。

2. Free-Taxi 异步输出模式

创新性地采用异步检测架构,在用户请求发起后立即返回初步响应,后台并行执行深度安全检查。

  • 用户侧:获得接近无感的低延迟体验
  • 安全侧:保留事后拦截与纠正能力

实现用户体验与安全强度的最优平衡

3. 多维响应策略矩阵

面对不同类型的风险,JoySafety 提供分级响应机制:

策略作用
精准拦截 🔴对高危内容(如违法信息)直接阻断
红线代答 ⏸️触及敏感话题时,自动切换至预设知识库回答
智能纠偏 🔄对潜在风险进行引导,促使模型生成正向回复

该机制既防止有害输出,又避免生硬中断对话,提升交互自然度。

数据统计

相关导航

暂无评论

none
暂无评论...