Stability AI释出Stable Diffusion 3 Medium模型,8G显存显卡即可使用 Stability AI终于在6月12日释出了万众期待的Stable Diffusion 3模型,不过此次释出的仅是 20 亿个参数的Stable Diffusion 3 Medium 模型,该型号尺... 图像模型# SD3模型# Stability AI# Stable Diffusion 3 Medium 2周前04,3730
字节跳动推出新型蒸馏模型Hyper-SD:基于SD1.5和SDXL1.0基础模型提炼 字节跳动在推出文生图模型SDXL-Lightning后,又推出了新的蒸馏模型Hyper-SD,它有效地结合了ODE轨迹保留和重构的优点,同时在步骤压缩过程中保持了接近无损的性能。与SDXL-Light... 图像模型# Hyper-SD# 字节跳动# 蒸馏模型 2周前09870
单目深度估算模型Depth Anything V2:通过分析单张图片来预测物体距离 来自香港大学和TikTok的研究人员推出单目深度估算模型Depth Anything的升级版Depth Anything V2,让计算机通过分析单张图片来预测物体距离的技术,这在自动驾驶、3D建模和虚... 图像模型# Depth Anything V2# 单目深度估算模型 2周前07760
文生图模型新架构MoA:根据用户的个性化需求生成包含特定人物的图像,同时保持原有模型的风格和多样性 Snap推出新架构注意力混合(Mixture-of-Attention,简称MoA),即在个性化图像生成中实现主体与上下文解耦的注意力混合模型(MoA),用于个性化文本到图像的扩散模型。简单来说,Mo... 图像模型# MoA# 文生图模型 2周前07470
全新开源背景移除模型ormbg:专门针对含有人物的图像进行了优化 ormbg是一个基于基于高度准确的二分类图像分割(DIS)的全新开源背景移除模型,它专门针对含有人物的图像进行了优化,此模型类似于 RMBG-1.4,但提供了开放的训练数据和流程,且商业使用免费。它提... 图像模型# DIS# ormbg# 背景移除模型 2周前07450
SDXL系列新模型SDXL Flash:高速且保证质量的SDXL模型 Stable Diffusion Community是一个非官方、非盈利性质的组织,它们主要目标是尽可能改进 SD 模型并让每个人都可以使用它们,近期它们推出了新的SDXL系列模型SDXL Flash... 图像模型# SDXL Flash# sdxl-flash-mini# 高速模型 2周前07400
虚拟服装试穿Magic Clothing:根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像 小i研究院发布了OOTDiffusion的分支版本Magic Clothing,它能够根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像。这项技术的核心在于高度的图像可控性,即在生成的图像中保... 图像模型# Magic Clothing# 虚拟服装试穿 2周前07160
强大且高效的图像和视频生成控制方法ControlNeXt:同时支持图像和视频,并能整合多种形式的控制信息 香港中文大学和思谋科技的研究人员推出强大且高效的图像和视频生成控制方法ControlNeXt,它同时支持图像和视频,并能整合多种形式的控制信息。在这个项目中,我们提出了一种新方法,与 ControlN... 图像模型# ControlNeXt 2周前07100
华为PixArt系列最新模型—PIXART-Σ:基于DiT,可直接生成4K分辨率的图像 来自华为诺亚方舟实验室、大连理工大学、香港大学的研究人员推出了最新的PixArt模型—PIXART-Σ,PixArt-Σ基于Diffusion Transformer架构 (DiT,与Sora、Sta... 图像模型# DiT# PIXART-Σ# 文生图模型 2周前06900
Stable Diffusion 1.5 Stable Diffusion 1.5 是由 Runway ML 开发,基于 Stable Diffusion 1.2 版本,于2022年10月发布,并进行了以下改进: 使用了更大的模型:Stabl... 图像模型# Runway ML# Stable Diffusion 1.5# 模型 2周前06490
高效且多功能的框架Ctrl-Adapter:在各种图像和视频生成模型中加入丰富的控制功能 北卡罗来纳大学教堂山分校的研究人员推出高效且多功能的框架CTRL-Adapter,它能够为任何图像或视频扩散模型添加多样的空间控制功能。它支持多种实用的应用,如视频控制、多条件视频控制、稀疏帧条件下的... 图像模型# Ctrl-Adapter# 空间控制# 视频生成模型 2周前06470
CosmicMan:专注于生成高保真人类图像的文生图基础模型 上海人工智能实验室推出CosmicMan,这是一款专注于生成高保真人类图像的文本到图像基础模型。CosmicMan能够生成外观精细、结构合理,并且与详细描述精确对齐的逼真人类图像。 项目主页:http... 图像模型# CosmicMan# 文生图模型 2周前06430