通义万象通义万象是阿里云旗下的图像及视频生成平台,凭借其强大的多模态生成能力,正在引领生成式 AI 的发展。除了传统的文生图能力,通义万象现已支持文生视频、图生视频等多种功能,并在插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化应用中表现出色。06,5330AI视频# WanX# 图像生成# 视频生成
MagiMAGI-1是由Sand AI研究团队开发的一种新型视频生成模型。该模型通过自回归预测视频块序列来生成视频,每个视频块由固定长度的连续帧组成。这是首个具有顶级质量输出的自回归视频模型,而且还是开源的,目前Sand AI还推出了视频生成平台Magi,不过目前仅支持图生视频。01,0290AI视频# MAGI-1# Sand AI# 自回归视频生成模型
SoraOpenAI于2024年2月公开了其AI视频生成(文生视频)模型Sora,它可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动和具有生动情感的多个角色,但直到12月才正式上线。07070AI视频# OpenAI# Sora# 文生视频
HedraHedra 是一个人工智能创作实验室,通过尖端的视频模型,赋能人类讲故事的能力。只需几秒钟,即可将您的角色变成富有表现力的说话者、歌手和说唱歌手。04620AI语音# Hedra# 对口型# 数字人
DiffSynth-StudioDiffSynth Studio 是一个开源的扩散引擎,专注于 AI 生成内容(AIGC)技术创新,特别适合学术研究。它通过连接开源扩散模型,提供尖端技术支持和新型推理能力,帮助用户探索图像和视频生成的新可能性。04240AI工具# DiffSynth Studio# DiffSynth-Engine# Diffusion引擎
Adobe Firefly Video由 Firefly 视频模型支持,创意专业人士可以从文本提示或图像生成视频片段,控制镜头角度,创建专业质量的图像,并开发自定义运动设计元素。该功能支持 1080p 分辨率,并即将推出 4K 模型。03660AI视频# Adobe# Adobe Firefly Video# Generate Video
Grok ImagineGrok Imagine 允许用户通过自然语言提示,直接生成视频和图像内容。它不仅支持“文生视频”,还具备以下能力:图像转动态视频:将静态图片转化为带声音的动态内容;最长生成 6 分钟视频:与当年 Vine 的 6 秒短视频形成鲜明对比,但马斯克称其为“以 AI 形式复活 Vine”;实时调整生成过程:用户可在生成中即时优化输出,无需导出或切换工具。0890AI绘画# AI绘画# Grok Imagine# 视频生成