可灵AI即将发布 Kling 2.6:原生支持音频,实现“视声一体”生成

早报3天前发布 小马良
3 0

据多方消息,可灵AI(Kling AI)将于 2025 年 12 月 3 日前后正式发布 Kling 2.6 视频生成模型,首次内置原生音频生成能力,支持人声说话、歌唱与环境音效,实现视频与声音的同步生成。

可灵AI即将发布 Kling 2.6:原生支持音频,实现“视声一体”生成

这一升级将使 Kling 成为少数能提供完整多模态生成工作流(图像 → 视频 + 音频)的国产 AI 视频模型,直接对标 OpenAI 的 Sora 2 与 Google 的 Veo 3.1

核心升级:原生音频集成

  • 同步生成:音频不再依赖后期配音或外接工具,而是在视频生成过程中与画面协同输出
  • 支持类型
    • 自然口语对话(中英双语首发)
    • 歌唱(含旋律与歌词对齐)
    • 环境音效(如雨声、街道、机械运转等)
  • 技术口号:“See the Sound, Hear the Visual”(看见声音,听见画面)

这意味着用户只需输入一段文本提示,即可获得带同步配音与配乐的完整短视频,大幅降低创作门槛。

产品演进:从 Kling 1.6 到 2.6

Kling 系列自 2024 年起快速迭代:

  • Kling 1.6–2.0:基础视频生成
  • Kling 2.5:支持高分辨率、精细动作控制、图像到视频
  • Kling Omni:多模态中心,整合文本、图像、视频生成
  • Kling 2.6补齐音频短板,形成“文-图-视-声”全链路

目前 Kling 已通过第三方平台(如字节、腾讯生态)向创作者和影视工作室提供 Turbo、Pro、Master 三级服务,2.6 将首先在 Pro 版本上线音频功能。

发布节奏:配合“Kling 发布周”

Kling 背后母公司 快手 宣布,自 12 月 1 日起连续五天发布 AI 新品。鉴于 Kling O1(多模态创作中枢)已于 12 月 1 日亮相,12 月 3 日作为 Kling 2.6 的发布日高度合理

初期音频功能预计将上线于:

  • Kling 官网网页工具
  • 快手 AI 创作平台
  • 合作伙伴 API
© 版权声明

相关文章

暂无评论

none
暂无评论...