图像编辑技术Paint by Inpaint:根据文本指令在图像中添加对象,而无需用户提供输入遮罩来自魏茨曼科学研究所和以色列理工学院的研究人员推出一种新颖的图像编辑技术Paint by Inpaint,它能够根据文本指令在图像中添加对象,而无需用户提供输入遮罩(mask)。这项技术的核心在于利用...新技术# Paint by Inpaint# 图像编辑1年前07480
新型图像编辑框架3DitScene:通过语言引导的解耦高斯散射来实现对任何场景图像的编辑香港中文大学、斯坦福大学、Snap、加州大学洛杉矶分校和字节跳动的研究人员推出新型图像编辑框架3DitScene,它能够通过语言引导的解耦高斯散射(Language-guided Disentangl...新技术# 3DitScene# 图像编辑框架2年前07460
NovelAI Diffusion V4.5 完整版发布,图像质量全面提升NovelAI 近日正式发布了NovelAI Diffusion V4.5 完整版模型(Full Version),将此前广受好评的 V4.5 Curated 版本中的增强功能带入完整模型中,进一步提...早报# NovelAI# NovelAI Diffusion V4.56个月前07450
无需调整的高分辨率框架HiDiffusion:只需添加一行代码即可提高扩散模型(Stable Diffusion)在生成高分辨率图像方面的能力和效率旷视科技与字节跳动的研究人员推出新型框架HiDiffusion,只需添加一行代码即可提高扩散模型(Stable Diffusion)在生成高分辨率图像方面的能力和效率。现有的扩散模型在生成超出训练时所...新技术# HiDiffusion# Stable Diffusion# 高分辨率框架2年前07450
3D场景生成技术BlockFusion:基于扩散模型的方法来创建和扩展3D场景来自腾讯、东京大学、澳大利亚国立大学、上海交通大学的研究人员推出新型3D场景生成技术BlockFusion,它使用基于扩散模型的方法来创建和扩展3D场景。 论文 BlockFusion的核心思想是将3...新技术# 3D场景生成# BlockFusion2年前07450
图像超分辨率技术StableSR:将低分辨率的图像转换为高分辨率的图像StableSR是来自南洋理工大学S实验室的研究人员开发的图像超分辨率技术,它可以将低分辨率的图像转换为高分辨率的图像。简单来说,这项技术可以让你看到的图片变得更加清晰和详细。 我们可以用一个生活中的...新技术# StableSR# 超分辨率2年前07420
Stable Diffusion 3 API正式发布,还计划在不久的将来通过会员资格提供模型Stability AI宣布Stable Diffusion 3及其增强版Stable Diffusion 3 Turbo API已经正式在其开发者平台上线。根据Stability AI的声明,Sta...早报# Stable Diffusion 3 API2年前07400
视频增强技术Noise Calibration(噪声校准):使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变大连理工大学和腾讯AI实验室的研究人员推出视频增强技术“Noise Calibration(噪声校准)”,它使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变。该技术通过少量迭代步...新技术# Noise Calibration# 噪声校准# 视频增强技术1年前07390
虚拟服装试穿工具OOTDiffusion:革新你的虚拟试衣体验OOTDiffusion是一款开源虚拟服装试穿工具,它利用潜在扩散模型(latent diffusion models)的强大能力实现了前所未有的高精度和可控性试穿体验。 GitHub:https...新技术# OOTDiffusion# 虚拟服装2年前07390
OpenAI公开AI视频生成模型Sora:可创建长达 60 秒的视频OpenAI公开了AI视频生成(文生视频)模型Sora,它可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动和具有生动情感的多个角色。 官方介绍 以下是官方介绍全文翻译: 我们正在...新技术# AI视频生成模型# OpenAI# Sora2年前07370
建立在多模态大语言模型基础上的统一文本到图像生成和检索框架TIGeR来自新加坡国立大学 NExT++ 实验室、南洋理工大学、香港理工大学和哈尔滨工业大学(深圳)的研究人员推出一个统一的文本到图像生成和检索框架TIGeR,这个框架建立在多模态大语言模型(MLLMs)的基...新技术# TIGeR# 文生图2年前07350
英伟达推出视频生成模型CMD:解决现有视频生成技术在处理高维视频数据时所面临的高内存和计算需求问题英伟达推出新型的视频生成模型内容-运动潜在扩散模型(Content-Motion Latent Diffusion Model,简称CMD),这个模型是为了解决现有视频生成技术在处理高维视频数据时所面...新技术# CMD# 英伟达2年前07330