亚马逊推出全新Nova模型系列及开创性服务：Nova Forge与Nova Act

大语言模型4个月前发布小马良

28 0

核心要点

Nova 2 模型系列在推理、多模态处理、对话式AI、代码生成及智能体任务方面提供业界领先的性价比。
Nova Forge 服务允许企业通过其独特的“开放训练”方法，在训练早期融入专有数据，构建自定义优化的Nova模型变体。
Nova Act 服务在早期客户构建的基于浏览器的UI自动化工作流中，实现了突破性的90% 可靠性。

亚马逊宣布对其Nova产品组合进行全面扩展，推出四款新模型、一项开创性的“开放训练”服务——Nova Forge（赋能企业基于Nova构建自定义模型变体），以及一项用于创建高可靠性AI智能体的服务——Nova Act。

地址：https://aws.amazon.com/cn/nova

数以万计的公司正将Nova用于多样化的应用场景，例如生成高质量内容、自动化多步骤任务以及加速AI智能体开发。亚马逊全新的 Nova 2 模型家族 在多个AI领域中平衡了速度、成本和智能水平：

亚马逊推出全新Nova模型系列及开创性服务：Nova Forge与Nova Act

Nova 2 Lite

一款快速、经济高效的推理模型，适用于日常工作任务，可处理文本、图像和视频以生成文本。客户可调整模型在响应前进行逐步“思考”的程度，以平衡智能深度与速度、成本，非常适合客服聊天机器人、文档处理和业务自动化。Nova 2 Lite在其智能级别中提供了业界领先的性价比。在15项基准测试中，与Claude Haiku 4.5相比，其在13项上持平或更优；在17项基准测试中，与GPT-5 Mini相比，其在11项上持平或更优；在18项基准测试中，与Gemini Flash 2.5相比，其在14项上持平或更优。该模型在处理文档、从视频中提取信息、生成代码、提供准确有据的回答以及自动化多步骤智能体工作流方面表现出色。

Nova 2 Pro

亚马逊最智能的推理模型，可处理文本、图像、视频和语音以生成文本。它非常适用于智能体编码、长期规划和复杂问题解决等需要最高准确性的高度复杂任务。该模型还可作为知识蒸馏的“教师”模型，将其能力转移到更小、更高效的特定领域“学生”模型中。在16项基准测试中，与Claude Sonnet 4.5相比，其在10项上持平或更优；在16项基准测试中，与GPT-5.1相比，其在8项上持平或更优；在19项基准测试中，与Gemini 2.5 Pro相比，其在15项上持平或更优；在18项基准测试中，与Gemini 3 Pro预览版相比，其在8项上持平或更优。Nova 2 Pro在多文档分析、视频推理、遵循复杂指令、解决高级数学问题以及执行智能体和软件工程任务方面展现出优势。

Nova 2 Lite和Nova 2 Pro均具备内置的网络信息检索和代码执行能力，这意味着它们能够搜索网络获取最新信息并直接运行代码，确保回答基于最新事实，而非仅依赖训练数据。

Nova 2 Sonic

亚马逊的语音到语音模型，集成了文本与语音的理解与生成，用于实现实时、类人的对话式AI。它具备扩展的多语言支持、富有表现力的语音、更高的准确性，以及用于持续交互的一百万token上下文窗口，同时支持语音与文本的无缝切换。该模型可异步处理任务，允许用户在后台完成航班预订等操作时，继续进行自然对话（甚至切换话题）。它还能与Amazon Connect、电信服务提供商以及对话式AI框架无缝集成，非常适合客服应用、AI助手和互动语音体验。与通过其实时API提供的OpenAI gpt-realtime和Gemini 2.5 Flash模型相比，Nova 2 Sonic提供了业界领先的性价比和质量。

Nova 2 Omni

一款统一的多模态推理与生成模型，能够处理文本、图像、视频和语音输入，同时生成文本和图像，这在业界尚属首次。它能处理多达75万个单词、数小时音频、长视频及上百页文档，可同时分析整个产品目录、客户评价、品牌指南和视频库，从而消除了连接多个专用模型的成本和复杂性。例如，营销团队可以分析所有格式的产品细节，在单一工作流中即时生成包含标题、文案、社交媒体帖子和视觉内容的完整营销活动。尽管业界目前尚无与Nova 2 Omni直接对标的模型，但它在文档、图像、视频和音频的多模态推理公共基准测试中展现出优势，并能生成与其他领先图像生成模型相似的高质量图像。

思科、西门子、Sumo Logic和Trellix等组织正在使用Nova 2模型，应用范围涵盖智能体威胁检测、视频理解和语音AI助手等领域。

Nova Forge：构建专属前沿AI模型的开创性服务

当前，将专有知识嵌入AI应用的组织面临三种妥协方案：要么以仅能浅层整合组织专业知识的方式定制专有模型；要么在无法访问原始训练数据的情况下继续训练开源模型，但这可能导致模型在指令遵循等基础能力上退步；或者以巨大成本从头开始构建。组织真正需要的是既能获取前沿模型能力，又能深度融合自身专业知识。

Nova Forge赋能组织通过将其专有数据与Nova的前沿能力相融合，构建自定义优化的Nova变体（称为“Novellas”）。该服务开创了“开放训练”模式——独家提供预训练、中期训练和后期训练的Nova模型检查点，让客户能够在模型训练的每个阶段，将其专有数据与亚马逊精心筛选的数据集混合使用。最终结果是获得一个定制化模型，它既拥有Nova的全部知识和推理能力，又深刻理解每个组织的具体业务。客户现在即可开始基于Nova 2 Lite构建自己的Novellas。此外，Nova Forge客户还能提前获得Nova 2 Pro和Nova 2 Omni的访问权限，从而在使用更强大的Nova模型构建应用和Novellas时抢占先机。

除了模型检查点和数据混合能力，Nova Forge还提供三项额外强大功能：首先，能够在称为强化学习“健身房”的自定义环境中训练AI。这些“健身房”是合成环境，模型在其中通过模拟真实用例的场景进行学习。其次，可选择创建更小、更快、以更低成本保持智能的模型，该功能通过基于合成数据的知识蒸馏过程（使用大模型生成的示例进行训练）实现。第三，可访问负责任AI工具包，以实施安全控制。

Booking.com、Cosine AI、Nimbus Therapeutics、野村综合研究所、OpenBabylon、Reddit和索尼等组织正利用Nova Forge构建自己的模型，以更好地满足其独特需求。

Reddit首席技术官Chris Slowe表示：“与Nova Forge合作使我们能够通过一个更统一的系统改进Reddit上的内容审核，该系统已经取得了令人瞩目的成果。我们正在用一个更准确、更高效的单一解决方案替代多个不同模型。用一个整体方法替代多个专门的机器学习工作流，标志着我们在Reddit实施和扩展AI方式的转变。在安全工作中看到这些早期成功后，我们渴望探索Nova Forge如何能在业务的其他领域提供帮助。”

客户使用Nova Forge创建自己的前沿模型后，可将其部署在Amazon Bedrock上，享有与其他所有Bedrock模型同等的企业级安全性、可扩展性和数据隐私性。这一完整的解决方案——从构建专属前沿模型到生产部署——确保了组织能够获得针对其特定业务需求优化的AI性能，并独家使用安全托管在AWS上的自有模型。

Nova Act：用于构建和管理基于UI工作流的高可靠性AI智能体的新AWS服务

Nova Act现已作为一项服务在AWS上线，用于构建和部署能在网络浏览器中执行操作的高可靠性AI智能体。该服务由定制的Nova 2 Lite模型驱动，为构建和管理自动化基于浏览器任务的智能体舰队提供了最快、最简单的途径。Nova Act在早期客户工作流中实现了90% 的可靠性，并在相关基准测试中超越了竞争模型。

Nova Act通过强化学习训练一个定制的Nova 2 Lite模型，在数百个模拟网络环境中运行数千项任务，从而实现了突破性的可靠性。这种训练方式使Nova Act在基于UI的工作流中表现出色，例如更新客户关系管理系统（CRM）中的数据、测试网站功能或提交健康保险索赔等。

借助Nova Act，开发人员可以在几分钟内，通过使用自然语言提示的无代码游乐场开始快速创建智能体原型，在VS Code等熟悉的IDE中优化该智能体，然后部署到AWS。客户本地构建和测试的内容可在生产环境中无缝扩展，并通过Nova Act AWS控制台获得全面的管理工具和监控。

各行业的组织已经在使用Nova Act取得成效：

初创公司Sola Systems 集成Nova Act，每月为客户自动化数十万个工作流，涵盖对账支付、协调运输和更新医疗记录等关键业务任务。
1Password 使用Nova Act，让用户以更少的步骤访问登录信息，并且只需一个简单的提示就能自动在数百个不同网站上工作。
赫兹通过使用Nova Act在其日处理数百万预订的租车平台上自动化端到端测试，将软件交付速度提高了5倍，并消除了质量保证（QA）瓶颈，将原本需要数周的工作缩短至数小时。
亚马逊Leo 在其卫星互联网服务推出前，利用Nova Act消除了QA限制。该服务能用自然语言编写测试场景，并在数千个Web和移动端测试案例中自动执行和调整，将先前需要数周工程投入的工作减少到几分钟，并且在初始运行后，以三倍速度运行且无需额外AI成本。