快手发布可灵 AI 2.0：可灵 2.0 视频生成模型和可图 2.0 图像生成模型，视频和图像生成能力全面升级

331 0

快手于4 月 15 日在“灵感成真”发布会上正式推出了可灵 AI 2.0 模型，包括可灵 2.0 视频生成模型和可图 2.0 图像生成模型。此次升级不仅在动态质量、语义响应和画面美学等维度保持全球领先，还引入了多模态编辑功能，为创作者提供了更强大的工具。

可灵 AI 2.0：视频生成的全新高度

1. 基础模型升级：可灵 2.0（大师版）

可灵 2.0（大师版）在多个关键维度上实现了显著提升：

语义响应大幅提升：动作、表情、运镜响应更佳，支持描述时序更复杂的镜头，轻松创作大片级画面。
动态质量大幅提升：角色/主体的动作幅度更大，速度更流畅，复杂动作更加细腻、自然、合理，让观众身临其境。
画面美感大幅提升：角色更真实，动作和表情堪比专业演员；画面更细致，文生视频可响应影视级别的画面描述，大片质感、纤毫毕现；风格更美，图生视频可以更好地保持原图画风，延续更多美感。

2. 多模态编辑功能

可灵 2.0 引入了多模态编辑功能，支持基于视频 + 文字/图片进行多种灵活修改和再创作：

替换元素：在多个关键帧上，指定视频中连续的内容选区，然后可用 1 张参考图对选择的主体、背景内容进行替换，例如模特换衣、人物修改。
删除元素：在多个关键帧上，指定视频中连续的内容选区，可以对选区的主体、背景内容进行删除，例如删除误入镜头的路人。
增加元素：可以输入 1-2 张参考图，或者通过文字描述的方式，对视频进行主体内容增加，例如让一艘太空飞船降临城市上空。

可图 2.0：图像生成的全面升级

1. 基础模型升级：可图 2.0

可图 2.0 在指令遵循、电影质感和艺术风格表现等方面显著提升：

指令遵循大幅提升：对多种元素、复杂指令、颜色位置等响应有大幅度提升，画面细节真实感强，生图结果更具异质性，提升可用率。
电影质感提升：电影大片的氛围和层次，图更有高级感，光影色彩为画面带来独特的美学调性。
多风格拓响应：支持 60 多种风格，涵盖特殊材质、数字艺术和绘画技法等，经典艺术风格不再只属于专业画师，每个人都能成为自己童话世界的造梦师。

2. 多模态编辑功能

可图 2.0 也上线了实用的图像可控编辑功能：

局部重绘：通过指定重绘区域，并提供目标内容的提示词描述，可对图片进行元素增加、元素修改等操作，生成内容与原图的融合自然度和真实感位于行业 top 水平。更好地满足图片素材二改的创作诉求，如修复残图、调整图片细节、创意 case 等。
扩图：扩图比例及尺寸更加自由，支持用户随意拖拽原图位置，改变原图大小，可自由扩充图片内容，放大画面视野；生成内容极具想象力，与原图融合度较高，为图片创作阶段提供尺寸“调节”工具，一键获得多尺寸图片，丰富创作素材。
风格转绘：上传图片输入风格描述提示词，即可一键召唤出你想要的风格效果，无论是日漫电影的治愈美学，还是盲盒手办的 Q 萌形象，所有风格任你切换。

用户数据与市场表现

自去年 6 月发布以来，可灵 AI 已累计完成超 20 次迭代。截至目前，可灵 AI 全球用户规模突破 2200 万，过去的 10 个月里，其月活用户量增长 25 倍，累计生成超过 1.68 亿个视频及 3.44 亿张图片。在团队内部的多项胜负率评测中，可灵 2.0 和可图 2.0 均稳居业内第一。（官方具体介绍）