
Sidekick
Sidekick 重新定义了自动化工具的使用方式:你不再需要“配置自动化”,而是“描述自动化”。它将 AI 从“辅助执行者”变为“主动构建者”,让每个人都能轻松创建复杂、可靠、可复用的工作流
随着生成式AI在企业场景中的广泛应用,内容安全、提示词注入、数据泄露等风险日益突出。如何确保大模型输出合规、稳定且可管控,已成为AI落地的关键挑战。

为此,京东正式开源其内部广泛使用的大模型安全框架——JoySafety。该框架已在京东多个核心业务中长期运行,覆盖AI导购、物流客服、销售助手、医疗问诊、商家工作台、法务咨询、安全问答等高敏感场景,日均调用量达亿级规模,攻击拦截率超过95%。
JoySafety 致力于为企业提供一套成熟、可靠、免费、可自托管的大模型安全解决方案,助力构建安全可控的AI应用体系。
JoySafety 并非实验性工具,而是经过复杂业务环境长期打磨的企业级安全中间件。
安全不应以牺牲可用性为代价。JoySafety 在设计上充分考虑了对业务的影响:
JoySafety 采用模块化设计,具备极强的可扩展性:
| 特性 | 说明 |
|---|---|
| 多模型支持 | 兼容 BERT、FastText、Transformer 等主流文本检测模型 |
| 标准化接口 | 所有“原子能力”通过统一接口接入,便于新增算法模块 |
| 部署模式灵活 | 支持独立部署(边缘节点)或集中式集群部署 |
| 轻量编排引擎 | 基于 DAG 的流程编排,按需组合检测策略 |
JoySafety 注重开发者体验,力求降低使用门槛:
docker-compose.yml 配置,本地环境零配置即可运行传统内容过滤多基于单条输入判断,易被绕过。JoySafety 支持对完整对话历史进行上下文感知分析,有效识别渐进式诱导、角色扮演等高级攻击手法。
创新性地采用异步检测架构,在用户请求发起后立即返回初步响应,后台并行执行深度安全检查。
- 用户侧:获得接近无感的低延迟体验
- 安全侧:保留事后拦截与纠正能力
实现用户体验与安全强度的最优平衡。
面对不同类型的风险,JoySafety 提供分级响应机制:
| 策略 | 作用 |
|---|---|
| 精准拦截 🔴 | 对高危内容(如违法信息)直接阻断 |
| 红线代答 ⏸️ | 触及敏感话题时,自动切换至预设知识库回答 |
| 智能纠偏 🔄 | 对潜在风险进行引导,促使模型生成正向回复 |
该机制既防止有害输出,又避免生硬中断对话,提升交互自然度。







