轨迹条件文本到4D生成方法TC4D:根据文本描述和一条轨迹生成动态的三维场景来自多伦多大学、Vector Institute、Snap、香港中文大学、斯坦福大学、香港大学、密歇根大学和 Google DeepMind的研究团队推出轨迹条件文本到4D生成方法TC4D(Traje...新技术# 4D# TC4D# 三维场景2年前05930
Midjourney 推出全新外部图像编辑功能、图像重新纹理化以及下一代AI审查系统由前 Magic Leap 工程师 David Holz 创立的 AI 图像生成初创公司Midjourney,昨晚宣布了一项令人瞩目的新功能——AI 图像编辑。这项功能不仅让现有的2000多万用户感到...教程# Midjourney# 图像编辑1年前05920
文本编码器Glyph-ByT5:为提高视觉文本渲染的准确性而设计来自微软亚洲研究院、清华大学、北京大学和澳大利亚国立大学的研究团队推出文本编码器Glyph-ByT5,它是为了提高视觉文本渲染的准确性而设计的。Glyph-ByT5通过微调一个字符感知的ByT5编码器...新技术# Glyph-ByT5# 文本编码器2年前05920
阿里推出新型视频生成框架I4VGen:无需训练且即插即用的视频扩散推理框架阿里推出新型视频生成框架I4VGen,这是一个无需训练(training-free)且即插即用(plug-and-play)的视频扩散推理框架,它通过强化图像技术来提升文本到视频(text-to-vi...新技术# I4VGen# 视频生成框架2年前05910
混合数据专家MoDE:通过聚类方法来提升对比语言-图像预训练(CLIP)的性能来自Meta、哥伦比亚大学、纽约大学和华盛顿大学的研究人员推出机器学习系统MoDE(Mixture of Data Experts,混合数据专家),它通过聚类方法来提升对比语言-图像预训练(CLIP...新技术# CLIP# MoDE# 混合数据专家2年前05910
3D场景编辑方法ReplaceAnything3D(RAM3D):通过文本提示在3D场景中替换特定的物体来自Meta、伦敦大学的研究人员推出一种基于文本引导的3D场景编辑方法ReplaceAnything3D(RAM3D),它允许用户通过文本提示在3D场景中替换特定的物体。这种方法结合了预训练的文本引导...新技术# 3D场景编辑# RAM3D# ReplaceAnything3D2年前05910
英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性英伟达推出图像生成模型家族Edify Image,它们能够生成高保真度的图像内容,并且具有像素级完美准确性。Edify Image利用了一系列级联的像素空间扩散模型,这些模型通过一个新颖的拉普拉斯扩散...新技术# Edify Image# 图像生成# 英伟达1年前05890
图像修补任务Reflecting Reality:专门用于创建逼真的镜面反射印度理工学院班加罗尔分校视觉与人工智能实验室、三星印度研发中心和牛津大学视觉几何组的研究人员推出Reflecting Reality,它专门用于创建逼真的镜面反射。简单来说,可以处理给定的图片,自动在...新技术# Reflecting Reality# 镜面反射1年前05890
新型蒸馏技术iCD:提升文本引导的图像编辑任务中的图像生成和编辑能力俄罗斯Yandex Research和高等经济大学的研究人员推出新型蒸馏技术Invertible Consistency Distillation(iCD),它用于提升文本引导的图像编辑任务中的图像生...新技术# iCD# 蒸馏技术2年前05890
新颖图像和视频处理框架MaGGIe:用于实现人类图像的精确分割,从图像和视频中提取人物前景来自马里兰大学和Adobe的研究人员推出新的图像和视频处理技术MaGGIe(Masked Guided Gradual Human Instance Matting),它用于实现人类图像的精确分割...新技术# MaGGIe# 图像分割# 抠图2年前05880
LoRA:为解决大语言模型微调而开发微软的研究人员于2021年推出LoRA(Low-Rank Adaptation of Large Language Models,大语言模型的低阶适应),这是为解决大语言模型微调而开发的一项技术,用于...新技术# Lora# 大语言模型# 微软2年前05880
FlashFace:允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片来自香港大学、阿里和蚂蚁的研究团队推出FlashFace,它允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片。 项目主页:https://jshilong.github.io/fla...新技术# FlashFace# 个性化2年前05870