新型4D内容生成管道4Diffusion:创造全新的视角和动态场景,而不仅仅是对现有视频进行剪辑和调整北京航空航天大学、上海人工智能实验室和香港大学的研究人员推出新型4D内容生成管道4Diffusion,它能够从单目视频生成具有空间-时间一致性的四维内容。简单来说,4Diffusion就像一个高级的视...新技术# 4Diffusion# 4D模型2年前07030
苹果推出新型图像生成模型Kaleido Diffusion:通过整合自回归的潜在先验来增强采样的图像多样性苹果和弗吉尼亚理工大学的研究人员推出新型图像生成模型Kaleido Diffusion,此模型旨在通过自回归潜在模型(autoregressive latent modeling)提高扩散模型(dif...新技术# Kaleido Diffusion# 图像生成模型# 苹果2年前05490
腾讯音乐娱乐推出开源虚拟人视频生成框架MusePose腾讯音乐娱乐旗下天琴实验室推出开源虚拟人视频生成框架MusePose,MusePose 是 Muse 开源系列的最后一个组件,与 MuseV 和 MuseTalk 一起,标志着向构建端到端虚拟人物生成...新技术# MusePose# 虚拟人2年前09590
新型图像编辑框架3DitScene:通过语言引导的解耦高斯散射来实现对任何场景图像的编辑香港中文大学、斯坦福大学、Snap、加州大学洛杉矶分校和字节跳动的研究人员推出新型图像编辑框架3DitScene,它能够通过语言引导的解耦高斯散射(Language-guided Disentangl...新技术# 3DitScene# 图像编辑框架2年前07510
文生视频新技术T2V-Turbo:快速生成高质量的视频,并且能够根据文本描述来创建视频内容来自加州大学圣巴巴拉分校、谷歌和滑铁卢大学的研究人员推出文生视频新技术T2V-Turbo,它可以快速生成高质量的视频,并且能够根据文本描述来创建视频内容。它将来自混合的不同可微奖励模型的反馈整合到预训...新技术# T2V-Turbo# 文生视频2年前07230
阿里推出高清长视频生成方法EasyAnimate:基于Transformer架构,能够高效地制作出高质量的视频内容阿里推出先进视频生成方法EasyAnimate,它基于Transformer架构,能够高效地制作出高质量的视频内容,目前EasyAnimate已能展现出生成包含144帧视频的能力。例如,你想要制作一段...新技术# EasyAnimate# 长视频生成1年前05140
新型可控图像动画方法MOFA-Video:能够根据给定的图像和额外的可控信号(例如人体标记、手动轨迹或提供的其他视频)或它们的组合生成视频来自东京大学和腾讯AI实验室推出新型可控图像动画方法MOFA-Video,能够根据给定的图像和额外的可控信号(例如人体标记、手动轨迹或提供的其他视频)或它们的组合,从给定的图像中生成视频。这与以往的方...新技术# MOFA-Video# 可控图像动画生成2年前09040
JINA AI推出新型多任务对比训练方法及其模型JINA CLIP:解决现有CLIP模型在文本检索任务中性能不佳的问题JINA AI推出新型多任务对比训练方法及其模型JINA CLIP,旨在解决现有CLIP(Contrastive Language-Image Pretraining,对比语言-图像预训练)模型在文本...新技术# JINA CLIP# 对比语言-图像预训练模型2年前05600
多模态框架MotionLLM:理解和解释人类行为,特别是通过分析人体动作和视频清华大学、香港中文大学(深圳)、国际数字经济学院和香港科技大学的研究人员推出人工智能系统MotionLLM,它的主要任务是理解和解释人类行为,特别是通过分析人体动作和视频。例如,你有一台智能相机,它不...新技术# MotionLLM# 多模态框架2年前01,0180
新型SD加速模型PCM:解决在高分辨率、文本条件图像生成中的一些现有问题而设计香港中文大学、 Avolution AI 、Hedra、上海人工智能实验室、商汤和斯坦福大学的研究人员推出新的SD加速模型PCM(Phased Consistency Model,分阶段一致性模型...新技术# LCM# PCM# SD模型2年前01,3190
新型视频扩散模型StreamV2V:实现实时的视频到视频转换德克萨斯大学奥斯汀分校和加州大学伯克利分校的研究人员推出新型视频扩散模型StreamV2V,它能够实现实时的视频到视频(Video-to-Video,简称V2V)翻译。这项技术允许用户通过提示(pro...新技术# StreamV2V# 视频扩散模型2年前05740
新型视频生成技术“CVD(协作视频扩散)”:生成从多个不同摄像机轨迹视角下观察同一场景的一致性视频斯坦福大学和香港中文大学的研究人员推出新型视频生成技术“协作视频扩散”(Collaborative Video Diffusion,简称CVD),这项技术的核心目标是能够生成从多个不同摄像机轨迹视角下...新技术# CVD# 协作视频扩散# 视频生成2年前01,0010