Wan2.1 GP:基于阿里视频生成模型Wan 2.1,8G显存即可生成视频Wan2.1 GP是一个基于阿里视频生成模型Wan 2.1的优化模型,专为普通消费级显卡用户优化,降低资源需求,同时提供强大的视频生成能力。它支持多种生成任务,包括文生视频(T2V)、图生视频(I2V...视频模型# Wan 2.1# Wan2.1 GP# 视频生成9个月前02330
OpenAI计划将视频生成工具Sora引入ChatGPT,拓展AI创作能力在本周五的一次Discord办公时间会议上,OpenAI的高管透露了其计划将AI视频生成工具 Sora 集成到广受欢迎的消费者聊天机器人 ChatGPT 中。这一举措标志着OpenAI正致力于进一步扩...早报# OpenAI# Sora# 视频生成9个月前02250
字节跳动推出统一的视频生成框架Phantom :通过跨模态对齐实现主体一致性的视频生成字节跳动的研究人员推出一个统一的视频生成框架Phantom ,通过跨模态对齐实现主体一致性的视频生成(Subject-to-Video, S2V),用于单主体和多主体参考,构建在现有的文本到视频和图像...新技术# Phantom# 字节跳动# 视频生成8个月前02750
Adobe 推出全新 Firefly 应用程序,扩展生成式 AI 产品线Adobe发布了全新的Firefly 应用程序,这是一款集生成图像、矢量和视频于一体的全面创意工具。它不仅提供了无与伦比的创意控制能力,还与 Adobe Creative Cloud 应用程序深度集成...早报# Adobe# Firefly# 视频生成10个月前02650
新型图生视频模型VidCRAFT3:能够同时控制相机运动、物体运动和光照方向复旦大学、浙江大学、华为诺亚方舟实验室、西湖大学的研究人员推出新型高质量图像到视频生成模型VidCRAFT3 ,能够同时控制相机运动、物体运动和光照方向。它通过解耦这些视觉元素的控制,实现了对生成视频...新技术# VidCRAFT3# 视频生成10个月前03640
新型视频生成技术Magic 1-For-1:通过优化内存消耗和推理延迟,快速生成高质量的视频内容北京大学、Hedra和英伟达的研究人员推出新型视频生成技术Magic 1-For-1 ,通过将复杂的文本到视频(T2V)生成任务分解为两个更简单的子任务:文本到图像(T2I)生成和图像到视频( I2V...视频模型# Magic 1-For-1# 视频生成10个月前02180
字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku香港大学和字节跳动的研究人员推出新型图像和视频生成模型家族Goku,它基于修正流Transformer 架构,实现了行业领先的图像和视频联合生成性能。Goku 的目标是通过高质量的视觉内容生成,推动媒...视频模型# Goku# 字节跳动# 视频生成10个月前04150
字节跳动推出新型身份保持视频生成方法EchoVideo字节跳动推出新型身份保持视频生成方法EchoVideo ,旨在通过多模态特征融合解决传统方法中存在的“复制粘贴”现象和身份相似度低的问题。该方法能够生成高质量、连贯且一致的视频内容,同时保持人物的身份...新技术# EchoVideo# 视频生成10个月前02480
新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制香港中文大学多媒体实验室、博智感知交互研究中心和Avolution AI的研究人员推出新型视频生成框架GS-DiT,旨在通过伪4D高斯场实现对视频内容的精确4D控制。GS-DiT通过构建伪4D高斯场并...新技术# GS-DiT# 视频生成11个月前03020
新型3D感知视频扩散方法DaS:实现对视频生成过程的多样化和精确控制香港科技大学、浙江大学、香港大学、南洋理工大学、武汉大学和德克萨斯农工大学的研究人员推出新型3D感知视频扩散方法“Diffusion as Shader(DaS)”,旨在实现对视频生成过程的多样化和精...新技术# DaS# 视频生成11个月前03080
基于扩散模型的人类视频生成框架AnchorCrafter:用于创建高保真度的主播风格产品推广视频。自动生成锚点风格的产品推广视频在在线商务、广告和消费者互动中展现出巨大的潜力。然而,尽管姿态引导的人类视频生成技术取得了显著进展,这一任务仍然充满挑战。特别是将人-物交互(Human-Object I...新技术# AnchorCrafter# 视频生成1年前03030
Free^2Guide:无梯度框架提升文本到视频(T2V)生成中的文本对齐扩散模型在文本到图像(T2I)和文本到视频(T2V)合成等生成任务中取得了显著成果。然而,在T2V生成中,实现准确的文本对齐仍然是一个具有挑战性的问题,尤其是在处理帧间复杂的时序依赖性时。现有的基于强...新技术# Free^2Guide# 视频生成1年前03080