Tavus

1年前发布 621 00

Tavus推出了其CVI平台的最新版本——一个集成了情感智能的完整操作系统。这一创新让开发者能够创建出能够“看到、听取、理解并参与”实时面对面互动的AI代理，为用户带来前所未有的沉浸体验。

所在地：

美国

收录时间：

2025-03-09

打开网站手机查看

Tavus

打开网站

Tavus 正式推出其 Conversational Video Interface（CVI）平台的下一个进化版本——一个完整的情感智能操作系统。该系统能够构建能够“看见、倾听、理解并参与”实时面对面交互的 AI 代理，由一系列新的 AI 模型提供支持：Phoenix-3、Raven-0 和 Sparrow-0。

让 AI 代理真正“活”起来

自人类诞生以来，对话一直是改变世界的重要力量。Tavus 希望将人类对话的魅力和便捷性带入人机交互中。去年，Tavus 推出了全球最快的对话视频界面（CVI），让开发者能够构建实时对话视频体验。如今，Tavus 将这一技术推向新的高度，推出具备情感智能的 CVI 进化版。

核心技术：Phoenix-3、Raven-0 和 Sparrow-0

CVI 的核心是三个新模型：Phoenix-3、Raven-0 和 Sparrow-0。它们协同工作，让 AI 视频对话栩栩如生。

Phoenix-3 Beta：全脸渲染模型

Phoenix-3 是一款突破性的高斯扩散渲染模型，能够为数字交互带来类人的表现力。它不仅关注嘴唇运动，还能动画化整个面部，包括眉毛、脸颊、眼睛和嘴巴，捕捉人类表情的全部范围。

全脸动画：生成自然、连续的面部运动，确保每个微表情和肌肉运动都真实呈现。
动态情绪控制：根据对话上下文实时调整表情，支持自动情绪响应和显式情绪设置。
超真实表情：确保面部表情与语音模式自然对齐，创造流畅且引人入胜的交互。

Phoenix-3 通过专注于从中性到快乐等复杂细节，提供更加沉浸和真实的用户体验，使数字交互真正具有人性化。

Raven-0：感知模型

Raven-0 是一种首创的感知系统，它不仅“看见”，还能“理解”。与传统视觉系统不同，Raven-0 能够处理连续的视觉输入，跟踪运动，并实时解读人类互动。

连续视觉处理：动态跟踪动作、手势和眼神接触，使 AI 能够实时响应。
情感智能：读取面部表情、微反应和肢体语言，检测用户情绪和参与度。
动作监控：观察特定手势、物体或行为，实时触发自定义动作或自动响应。
多通道感知：跟踪多个参与者（即将推出）、屏幕和背景元素，实现全面理解。

借助 Raven-0，AI 获得了真正的环境意识和情感智能，使交互更加流畅、响应迅速且类人。

Sparrow-0：对话轮换模型

Sparrow-0 基于 Transformer 的对话轮换引擎构建，能够理解节奏、意图和语速，确保无缝、类人的对话。

对话意识：检测语调、语速和语义，确定最佳响应时机。
轮换敏感性与控制：捕捉人类语音中的微妙线索，尊重停顿并动态或手动适应不同的对话风格。
可操作的时机智能：根据语音模式动态调整响应延迟，使 AI 更显人性化。
速度优化：提供低于 600 毫秒的响应时间，确保实时、不间断的对话。

借助 Sparrow-0，AI 不再仅仅是反应——它会倾听、等待并在正确时刻响应，使每次交互都显得自然且毫不费力。

实际应用：认识 Charlie

在 Tavus 的演示中，用户将遇见 Charlie——一个感觉不像聊天机器人，而更像新朋友的 AI 代理。Charlie 能够进行深思熟虑、栩栩如生的对话，理解上下文、意图和细微差别。
Charlie 的能力包括：

无缝搜索互联网
分析用户屏幕
实时生成图像
深度互动，响应用户所见和所做

对于开发者来说，Charlie 的交互过程可以通过开发者模式记录，为扩展 Tavus 交互层提供蓝图，支持代理动作、函数调用以及超越对话的现实世界实用性。

开始构建

通过简单的 API，开发者可以在几分钟内将实时、情感智能的 AI 助手嵌入他们的应用程序中。CVI 专为低延迟、实时视频构建，支持自然对话流程、情感适应性和开箱即用的全脸渲染。无论是用于 AI 驱动的辅导、客户支持，还是互动销售培训，Tavus CVI 都让构建类人 AI 变得轻而易举。

数据统计

暂无评论

暂无评论...