快手发布可灵 AI 2.0:可灵 2.0 视频生成模型和可图 2.0 图像生成模型,视频和图像生成能力全面升级

早报1个月前发布 小马良
77 0

快手于4 月 15 日在“灵感成真”发布会上正式推出了可灵 AI 2.0 模型,包括可灵 2.0 视频生成模型和可图 2.0 图像生成模型。此次升级不仅在动态质量、语义响应和画面美学等维度保持全球领先,还引入了多模态编辑功能,为创作者提供了更强大的工具。

快手发布可灵 AI 2.0:可灵 2.0 视频生成模型和可图 2.0 图像生成模型,视频和图像生成能力全面升级

可灵 AI 2.0:视频生成的全新高度

1. 基础模型升级:可灵 2.0(大师版)

可灵 2.0(大师版)在多个关键维度上实现了显著提升:

  • 语义响应大幅提升:动作、表情、运镜响应更佳,支持描述时序更复杂的镜头,轻松创作大片级画面。
  • 动态质量大幅提升:角色/主体的动作幅度更大,速度更流畅,复杂动作更加细腻、自然、合理,让观众身临其境。
  • 画面美感大幅提升:角色更真实,动作和表情堪比专业演员;画面更细致,文生视频可响应影视级别的画面描述,大片质感、纤毫毕现;风格更美,图生视频可以更好地保持原图画风,延续更多美感。

2. 多模态编辑功能

可灵 2.0 引入了多模态编辑功能,支持基于视频 + 文字/图片进行多种灵活修改和再创作:

  • 替换元素:在多个关键帧上,指定视频中连续的内容选区,然后可用 1 张参考图对选择的主体、背景内容进行替换,例如模特换衣、人物修改。
  • 删除元素:在多个关键帧上,指定视频中连续的内容选区,可以对选区的主体、背景内容进行删除,例如删除误入镜头的路人。
  • 增加元素:可以输入 1-2 张参考图,或者通过文字描述的方式,对视频进行主体内容增加,例如让一艘太空飞船降临城市上空。
快手发布可灵 AI 2.0:可灵 2.0 视频生成模型和可图 2.0 图像生成模型,视频和图像生成能力全面升级

可图 2.0:图像生成的全面升级

1. 基础模型升级:可图 2.0

可图 2.0 在指令遵循、电影质感和艺术风格表现等方面显著提升:

  • 指令遵循大幅提升:对多种元素、复杂指令、颜色位置等响应有大幅度提升,画面细节真实感强,生图结果更具异质性,提升可用率。
  • 电影质感提升:电影大片的氛围和层次,图更有高级感,光影色彩为画面带来独特的美学调性。
  • 多风格拓响应:支持 60 多种风格,涵盖特殊材质、数字艺术和绘画技法等,经典艺术风格不再只属于专业画师,每个人都能成为自己童话世界的造梦师。

2. 多模态编辑功能

可图 2.0 也上线了实用的图像可控编辑功能:

  • 局部重绘:通过指定重绘区域,并提供目标内容的提示词描述,可对图片进行元素增加、元素修改等操作,生成内容与原图的融合自然度和真实感位于行业 top 水平。更好地满足图片素材二改的创作诉求,如修复残图、调整图片细节、创意 case 等。
  • 扩图:扩图比例及尺寸更加自由,支持用户随意拖拽原图位置,改变原图大小,可自由扩充图片内容,放大画面视野;生成内容极具想象力,与原图融合度较高,为图片创作阶段提供尺寸“调节”工具,一键获得多尺寸图片,丰富创作素材。
  • 风格转绘:上传图片输入风格描述提示词,即可一键召唤出你想要的风格效果,无论是日漫电影的治愈美学,还是盲盒手办的 Q 萌形象,所有风格任你切换。
快手发布可灵 AI 2.0:可灵 2.0 视频生成模型和可图 2.0 图像生成模型,视频和图像生成能力全面升级

用户数据与市场表现

自去年 6 月发布以来,可灵 AI 已累计完成超 20 次迭代。截至目前,可灵 AI 全球用户规模突破 2200 万,过去的 10 个月里,其月活用户量增长 25 倍,累计生成超过 1.68 亿个视频及 3.44 亿张图片。在团队内部的多项胜负率评测中,可灵 2.0 和可图 2.0 均稳居业内第一。(官方具体介绍

© 版权声明

相关文章

暂无评论

none
暂无评论...