新型图像编辑框架DesignEdit:实现精确的空间感知图像编辑微软亚洲研究院和北京大学的研究人员推出新型图像编辑框架DesignEdit,它能够实现精确的空间感知图像编辑。开发团队借鉴了设计领域的图层概念,通过灵活应用多种操作来操控图像中的对象。我们的核心思想是...新技术# DesignEdit# 图像编辑2年前06060
新型图像生成模型VAR:基于Transformer的自回归模型来自北京大学和字节跳动的研究人员推出新型图像生成模型VAR(Visual Autoregressive Modeling,“视觉自回归建模”),VAR模型是一种基于Transformer的自回归(au...新技术# VAR模型2年前06060
子对象级图像标记化:用于计算机视觉模型的图像处理来自香港科技大学与小冰AI的研究人员推出名为“子对象级图像标记化”(subobject-level image tokenization)的新方法,这是一种用于计算机视觉模型的图像处理技术。这种方法受...新技术# 子对象级图像标记化2年前06050
基于Transformer架构的新型视频生成模型Snap Video来自Snap、特伦托大学、加州大学默塞德分校、布鲁诺·凯斯勒基金会的研究人员推出新型视频生成模型Snap Video,此模型基于Transformer架构,目标是将文本描述转换成高质量的视频内容。 项...新技术# Snap Video# Transformer# 视频生成模型2年前06050
字节跳动推出新颖视频合成方法Boximator:可控制画面范围及运动方向字节跳动发布了一种新颖视频合成方法Boximator,主要用于生成具有丰富和精细运动控制的高质量视频。Boximator引入了两种约束类型:硬边框(hard box)和软边框(soft box),允许...新技术# Boximator# 字节跳动# 视频合成2年前06020
OpenAI旗下模型选型指南:全面解析 GPT 系列与 o 系列,助你精准选择适合的 AI 模型OpenAI于近期接连发布了多个新的模型,但命名上的混乱让许多用户难以区分这些模型之间的区别。例如,GPT 4o、GPT-4o mini、o3、o4-mini、GPT-4.1、GPT 4.5,这些模型...科普# AI 模型# ChatGPT# OpenAI8个月前06000
多模态大语言模型Oryx:专门设计用于理解和处理视觉数据,如图像、视频和3D场景清华大学、腾讯和南洋理工大学 S-Lab的研究人员推出多模态大语言模型Oryx,它专门设计用于理解和处理视觉数据,如图像、视频和3D场景。Oryx模型的特点是能够根据需要处理任意空间大小和时间长度的视...新技术# Oryx# 多模态大语言模型1年前06000
虚拟试穿扩散模型CatVTON:允许用户在不实际穿上衣物的情况下,通过照片来预览衣物穿在身上的效果中山大学、Pixocial Technology、鹏程实验室和中科院深圳先进技术研究院的研究人员推出一种简单高效的虚拟试穿扩散模型CatVTON,它通过将任意类别的商店衣物或已穿戴衣物与目标人物图像在...新技术# CatVTON# 虚拟试穿1年前06000
基于偏好学习的奖励模型VADER:让模型更有效地学习如何生成符合特定要求的视频卡内基梅隆大学的研究人员推出奖励模型(一种基于偏好学习的方法)VADER,来指导视频生成过程,从而让模型更有效地学习如何生成符合特定要求的视频。例如,你想要生成一段描述“一只穿着红色外套、拿着雪球的浣...新技术# VADER# 奖励模型1年前06000
视觉变换器VisionLLaMA:基于LLaMA架构设计,用于处理图像任务来自美团、浙江大学、Moonshot AI的研究人员推出名为VisionLLaMA的新型视觉变换器(Vision Transformer),它是基于LLaMA(Large Language Model...新技术# VisionLLaMA# 视觉变换器2年前06000
AI视频生成系统Direct-a-Video:像导演拍摄视频一样生成视频Direct-a-Video是一个AI视频生成系统,该系统允许用户独立地为一个或多个对象和/或相机运动指定运动,就像导演拍摄视频一样。 项目主页 开发者提出了一种简单而有效的策略,用于分别控制对象运动...新技术# AI视频生成# Direct-a-Video2年前06000
AI视频生成模型Animated Stickers:让静态表情包动起来来自Meta的研究人员推出了AI视频生成模型Animated Stickers,它可以让普通表情包图片“动”起来。这项技术的核心是利用先进的文本到图像(Text-to-Image)模型,通过添加时间层...新技术# AI视频生成模型# Animated Stickers# 表情包2年前05990