矩形扩散Rectified Diffusion:提高扩散模型的生成速度香港中文大学、北京大学和普林斯顿大学的研究人员推出Rectified Diffusion,它用于加速生成扩散模型(diffusion models),这些模型在视觉生成领域取得了显著的进展,比如生成高...百科# Rectified Diffusion# 矩形扩散1年前06100
DistriFusion:加速高分辨率扩散模型的并行推理算法来自麻省理工学院、普林斯顿大学、Lepton AI 和 英伟达的研究人员推出DistriFusion,这是一种用于加速高分辨率扩散模型(diffusion models)的并行推理算法。 项目主页 G...新技术# DistriFusion# 高分辨率扩散模型2年前06100
新型图像编辑框架SEELE:图像主体重新定位来自复旦大学的研究人员推出了一种新型图像编辑框架SEELE(SEgment-gEnerate-and-bLEnd),它专注于在图像中重新定位指定的对象(即“主体”),同时保持图像的整体质量。 项目主页...新技术# SEELE# 图像编辑2年前06100
图像编辑技术MimicBrush:允许用户指定源图像中需要编辑的区域,并提供一个参考图像,来展示编辑后期望的效果香港大学、阿里巴巴集团和蚂蚁集团的研究人员推出图像编辑技术MimicBrush,它通过模仿(imitative editing)的方式,让用户能够更加方便地发挥创造力进行图像编辑。简单来说,Mimic...新技术# MimicBrush# 图像编辑1年前06090
微软发布复现Sora的开源项目:新型多智能体框架Mora来自理海大学和微软研究院的研究团队推出新型多智能体框架Mora,它是为了实现大规模的通用视频生成而设计的。Mora的设计灵感来自于OpenAI在2024年2月推出的Sora模型,Sora是一个能够将文...新技术# Mora# Sora# 微软2年前06090
英伟达开源ConsiStory:免训练保持角色和物品一致性的文生图方法来自特拉维夫大学和英伟达的研究人员提出了一种创新方法ConsiStory,它允许用户通过自然语言描述生成一系列图像,这些图像不仅能够保持一致的主题,而且能够遵循文本提示。ConsiStory的核心目标...新技术# ConsiStory# 英伟达1年前06090
剪映推出AI创作助手「小云雀」:一句指令,生成专业级视频与图片剪映近日正式上线了一款 AI 视频与图像创作助手——小云雀AI,面向普通用户与创作者提供零门槛的智能内容创作体验。无论是短视频制作、数字人播报、图片设计还是背景更换,只需输入简单指令,即可快速生成高质...早报# 剪映# 小云雀6个月前06070
新型AI模型PT-DiT:针对文本到任意任务(如文本到图像、文本到视频等)的高效能扩散变换器中山大学 & 360人工智能研究院的研究人员推出一种新的人工智能模型PT-DiT,它是一种针对文本到任意任务(如文本到图像、文本到视频等)的高效能扩散变换器。这个模型特别关注于提高计算效率,减...新技术# PT-DiT# Qihoo-T2X1年前06070
无需额外训练的新型过渡视频生成方法TVG:在不同场景或画面之间流畅过渡的视频效果索贝媒体智能实验室、四川大学网络科学与工程学院、数据保护与智能管理教育部重点实验室(四川大学)和中国电子科技大学的研究人员推出一种无需额外训练的新型过渡视频生成方法TVG,它是一种无需训练就能生成平滑...新技术# TVG# 视频生成1年前06070
针对姿势引导的人像图像动画技术TCAN:让图片中的人物根据某个动作序列(比如一个视频)来做出相应的动作韩国科学技术院和Naver的研究人员推出一种针对姿势引导的人像图像动画技术TCAN,该技术能有效抵抗姿态估计错误,并在时间维度上保持连贯。这是一个关于如何让静态图片中的人体动作起来的研究,具体来说,就...新技术# TCAN# 人像图像动画1年前06070
零样本视频定制框架DreamVideo-2:根据单一图像和一系列界定框序列生成具有特定主题和运动轨迹的视频复旦大学、阿里巴巴、南洋理工大学和密歇根州立大学的研究人员推出一个零样本视频定制框架DreamVideo-2,能够根据单一图像和一系列界定框(bounding box)序列生成具有特定主题和运动轨迹的...新技术# DreamVideo-2# 视频定制1年前06060
新型图像生成模型VAR:基于Transformer的自回归模型来自北京大学和字节跳动的研究人员推出新型图像生成模型VAR(Visual Autoregressive Modeling,“视觉自回归建模”),VAR模型是一种基于Transformer的自回归(au...新技术# VAR模型2年前06060