亚马逊推出全新Nova模型系列及开创性服务:Nova Forge与Nova Act

核心要点

  • Nova 2 模型系列在推理、多模态处理、对话式AI、代码生成及智能体任务方面提供业界领先的性价比。
  • Nova Forge 服务允许企业通过其独特的“开放训练”方法,在训练早期融入专有数据,构建自定义优化的Nova模型变体。
  • Nova Act 服务在早期客户构建的基于浏览器的UI自动化工作流中,实现了突破性的90% 可靠性。

亚马逊宣布对其Nova产品组合进行全面扩展,推出四款新模型、一项开创性的“开放训练”服务——Nova Forge(赋能企业基于Nova构建自定义模型变体),以及一项用于创建高可靠性AI智能体的服务——Nova Act

数以万计的公司正将Nova用于多样化的应用场景,例如生成高质量内容、自动化多步骤任务以及加速AI智能体开发。亚马逊全新的 Nova 2 模型家族 在多个AI领域中平衡了速度、成本和智能水平:

亚马逊推出全新Nova模型系列及开创性服务:Nova Forge与Nova Act

Nova 2 Lite

一款快速、经济高效的推理模型,适用于日常工作任务,可处理文本、图像和视频以生成文本。客户可调整模型在响应前进行逐步“思考”的程度,以平衡智能深度与速度、成本,非常适合客服聊天机器人、文档处理和业务自动化。Nova 2 Lite在其智能级别中提供了业界领先的性价比。在15项基准测试中,与Claude Haiku 4.5相比,其在13项上持平或更优;在17项基准测试中,与GPT-5 Mini相比,其在11项上持平或更优;在18项基准测试中,与Gemini Flash 2.5相比,其在14项上持平或更优。该模型在处理文档、从视频中提取信息、生成代码、提供准确有据的回答以及自动化多步骤智能体工作流方面表现出色。

亚马逊推出全新Nova模型系列及开创性服务:Nova Forge与Nova Act

Nova 2 Pro

亚马逊最智能的推理模型,可处理文本、图像、视频和语音以生成文本。它非常适用于智能体编码、长期规划和复杂问题解决等需要最高准确性的高度复杂任务。该模型还可作为知识蒸馏的“教师”模型,将其能力转移到更小、更高效的特定领域“学生”模型中。在16项基准测试中,与Claude Sonnet 4.5相比,其在10项上持平或更优;在16项基准测试中,与GPT-5.1相比,其在8项上持平或更优;在19项基准测试中,与Gemini 2.5 Pro相比,其在15项上持平或更优;在18项基准测试中,与Gemini 3 Pro预览版相比,其在8项上持平或更优。Nova 2 Pro在多文档分析、视频推理、遵循复杂指令、解决高级数学问题以及执行智能体和软件工程任务方面展现出优势。

亚马逊推出全新Nova模型系列及开创性服务:Nova Forge与Nova Act

Nova 2 Lite和Nova 2 Pro均具备内置的网络信息检索和代码执行能力,这意味着它们能够搜索网络获取最新信息并直接运行代码,确保回答基于最新事实,而非仅依赖训练数据。

Nova 2 Sonic

亚马逊的语音到语音模型,集成了文本与语音的理解与生成,用于实现实时、类人的对话式AI。它具备扩展的多语言支持、富有表现力的语音、更高的准确性,以及用于持续交互的一百万token上下文窗口,同时支持语音与文本的无缝切换。该模型可异步处理任务,允许用户在后台完成航班预订等操作时,继续进行自然对话(甚至切换话题)。它还能与Amazon Connect、电信服务提供商以及对话式AI框架无缝集成,非常适合客服应用、AI助手和互动语音体验。与通过其实时API提供的OpenAI gpt-realtime和Gemini 2.5 Flash模型相比,Nova 2 Sonic提供了业界领先的性价比和质量。

Nova 2 Omni

一款统一的多模态推理与生成模型,能够处理文本、图像、视频和语音输入,同时生成文本和图像,这在业界尚属首次。它能处理多达75万个单词、数小时音频、长视频及上百页文档,可同时分析整个产品目录、客户评价、品牌指南和视频库,从而消除了连接多个专用模型的成本和复杂性。例如,营销团队可以分析所有格式的产品细节,在单一工作流中即时生成包含标题、文案、社交媒体帖子和视觉内容的完整营销活动。尽管业界目前尚无与Nova 2 Omni直接对标的模型,但它在文档、图像、视频和音频的多模态推理公共基准测试中展现出优势,并能生成与其他领先图像生成模型相似的高质量图像。

思科、西门子、Sumo Logic和Trellix等组织正在使用Nova 2模型,应用范围涵盖智能体威胁检测、视频理解和语音AI助手等领域。

Nova Forge:构建专属前沿AI模型的开创性服务

当前,将专有知识嵌入AI应用的组织面临三种妥协方案:要么以仅能浅层整合组织专业知识的方式定制专有模型;要么在无法访问原始训练数据的情况下继续训练开源模型,但这可能导致模型在指令遵循等基础能力上退步;或者以巨大成本从头开始构建。组织真正需要的是既能获取前沿模型能力,又能深度融合自身专业知识。

Nova Forge赋能组织通过将其专有数据与Nova的前沿能力相融合,构建自定义优化的Nova变体(称为“Novellas”)。该服务开创了“开放训练”模式——独家提供预训练、中期训练和后期训练的Nova模型检查点,让客户能够在模型训练的每个阶段,将其专有数据与亚马逊精心筛选的数据集混合使用。最终结果是获得一个定制化模型,它既拥有Nova的全部知识和推理能力,又深刻理解每个组织的具体业务。客户现在即可开始基于Nova 2 Lite构建自己的Novellas。此外,Nova Forge客户还能提前获得Nova 2 Pro和Nova 2 Omni的访问权限,从而在使用更强大的Nova模型构建应用和Novellas时抢占先机。

除了模型检查点和数据混合能力,Nova Forge还提供三项额外强大功能:首先,能够在称为强化学习“健身房”的自定义环境中训练AI。这些“健身房”是合成环境,模型在其中通过模拟真实用例的场景进行学习。其次,可选择创建更小、更快、以更低成本保持智能的模型,该功能通过基于合成数据的知识蒸馏过程(使用大模型生成的示例进行训练)实现。第三,可访问负责任AI工具包,以实施安全控制。

Booking.com、Cosine AI、Nimbus Therapeutics、野村综合研究所、OpenBabylon、Reddit和索尼等组织正利用Nova Forge构建自己的模型,以更好地满足其独特需求。

Reddit首席技术官Chris Slowe表示:“与Nova Forge合作使我们能够通过一个更统一的系统改进Reddit上的内容审核,该系统已经取得了令人瞩目的成果。我们正在用一个更准确、更高效的单一解决方案替代多个不同模型。用一个整体方法替代多个专门的机器学习工作流,标志着我们在Reddit实施和扩展AI方式的转变。在安全工作中看到这些早期成功后,我们渴望探索Nova Forge如何能在业务的其他领域提供帮助。”

客户使用Nova Forge创建自己的前沿模型后,可将其部署在Amazon Bedrock上,享有与其他所有Bedrock模型同等的企业级安全性、可扩展性和数据隐私性。这一完整的解决方案——从构建专属前沿模型到生产部署——确保了组织能够获得针对其特定业务需求优化的AI性能,并独家使用安全托管在AWS上的自有模型。

Nova Act:用于构建和管理基于UI工作流的高可靠性AI智能体的新AWS服务

Nova Act现已作为一项服务在AWS上线,用于构建和部署能在网络浏览器中执行操作的高可靠性AI智能体。该服务由定制的Nova 2 Lite模型驱动,为构建和管理自动化基于浏览器任务的智能体舰队提供了最快、最简单的途径。Nova Act在早期客户工作流中实现了90% 的可靠性,并在相关基准测试中超越了竞争模型。

Nova Act通过强化学习训练一个定制的Nova 2 Lite模型,在数百个模拟网络环境中运行数千项任务,从而实现了突破性的可靠性。这种训练方式使Nova Act在基于UI的工作流中表现出色,例如更新客户关系管理系统(CRM)中的数据、测试网站功能或提交健康保险索赔等。

借助Nova Act,开发人员可以在几分钟内,通过使用自然语言提示的无代码游乐场开始快速创建智能体原型,在VS Code等熟悉的IDE中优化该智能体,然后部署到AWS。客户本地构建和测试的内容可在生产环境中无缝扩展,并通过Nova Act AWS控制台获得全面的管理工具和监控。

各行业的组织已经在使用Nova Act取得成效:

  • 初创公司Sola Systems 集成Nova Act,每月为客户自动化数十万个工作流,涵盖对账支付、协调运输和更新医疗记录等关键业务任务。
  • 1Password 使用Nova Act,让用户以更少的步骤访问登录信息,并且只需一个简单的提示就能自动在数百个不同网站上工作。
  • 赫兹 通过使用Nova Act在其日处理数百万预订的租车平台上自动化端到端测试,将软件交付速度提高了5倍,并消除了质量保证(QA)瓶颈,将原本需要数周的工作缩短至数小时。
  • 亚马逊Leo 在其卫星互联网服务推出前,利用Nova Act消除了QA限制。该服务能用自然语言编写测试场景,并在数千个Web和移动端测试案例中自动执行和调整,将先前需要数周工程投入的工作减少到几分钟,并且在初始运行后,以三倍速度运行且无需额外AI成本。
© 版权声明

相关文章

暂无评论

none
暂无评论...