Collov Labs推出非自回归掩码图像建模的文本到图像合成模型Monetico Collov Labs 最近在8块H100 GPU上训练了一周时间,推出了新的非自回归掩码图像建模的文本到图像合成模型——Monetico。这款模型能够生成高分辨率图像,并且被设计为在消费级显卡上高效... 图像模型# Monetico# 文生图模型 2周前02040
智谱AI推出CogVideoX 开源模型的升级版本CogVideoX1.5-5B 智谱技术团队对于旗下开源视频生成模型CogVideoX进行了升级,今天释出了CogVideoX1.5-5B 系列模型,相比于原有模型,CogVideoX v1.5 将包含 5/10 秒、768P、16... 视频模型# CogVideoX1.5-5B# 智谱AI# 智谱清影 2周前02270
Mann-E FLUX[Dev]:微调Flux Dev模型,在写实与电影风格表现较好 Mann-E FLUX[Dev] 是一款微调Flux Dev模型,在写实与电影风格表现较好,开发者还提供了量化版本。 模型:https://huggingface.co/mann-e/mann-e_f... Flux衍生# Flux Dev# Mann-E FLUX[Dev] 2周前01680
腾讯开源高效3D生成模型 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型 尽管3D生成模型极大地改善了艺术家的工作流程,但现有的3D扩散模型在生成速度和泛化能力方面仍存在不足。为了解决这些问题,腾讯开发了一个名为 Hunyuan3D-1.0 的统一框架,它用于文本到3D(T... 3D模型# 3D 开源大模型# Hunyuan3D-1.0# 腾讯 2周前02060
挚文集团推出HelloMeme:用于生成表情包视频 挚文集团推出HelloMeme,它通过在文本到图像的基础模型中集成空间编织注意力(Spatial Knitting Attentions, SK Attentions)来嵌入高水平和高保真度的条件,以... 视频模型# HelloMeme# 表情包视频 2周前02270
基于扩散模型(SDXL)的新型图像恢复方法InstantIR 盲图像恢复(Blind Image Restoration, BIR)的主要挑战之一是处理测试时未知的退化,这需要模型具备高泛化能力。北京大学、InstantX团队和香港中文大学的研究人员提出了一种新... 图像模型# InstantIR# 即时参考图像恢复# 高清修复 2周前03090
阿里通义团队推出图像生成新型框架In-Context LoRA:利用现有的DiT架构模型(Flux模型)的上下文生成能力,通过提示词生成连贯图像 随着深度学习技术的发展,图像生成领域取得了显著进展。DiT架构作为一种新兴方法,通过简单地将注意力机制应用于图像连接,实现了任务无关的图像生成。然而,即便投入大量计算资源,生成图像的质量仍有待提升。 ... Flux衍生# FLUX模型# IC-LoRA# In-Context LoRA 2周前03180
Sleeveface :基于 FLUX.1-dev 的风格LoRA,专门设计用来重现2000年代流行的“Sleeveface”风格 Sleeveface 是一款基于 FLUX.1-dev 的概念LoRA,专门设计用来重现2000年代流行的“Sleeveface”风格的图像。这种风格的图像通常展示一个人手持一张专辑封面,巧妙地将其与... Flux衍生# FLUX.1-dev# Sleeveface 2周前02410
Then and Now:基于 FLUX.1-dev 的概念LoRA,创作“图中图”效果 Then and Now 是基于 FLUX.1-dev 的概念LoRA,旨在创作“图中图”效果,即在同一个位置的不同时间点的照片之间进行叠加,使两者周围的环境对齐。这种技术能够生成将历史场景与其现代设... Flux衍生# FLUX.1-dev# Then and Now# 图中图 2周前01780
flux-ip-adapter-v2:基于FLUX.1-dev的风格迁移IP-Adapter 模型 XLabs-AI推出了很多基于FLUX.1-dev 模型的ControlNet模型,近期XLabs-AI又推出了基于FLUX.1-dev的IP-Adapter 模型,支持支持 512 和 1024 分... Flux衍生插件# flux-ip-adapter-v2# FLUX.1-dev 模型# IP-Adapter 模型 2周前02520
高容量真实世界图像恢复模型DreamClear:结合隐私安全的数据处理流程(GenIR)和DiT技术,以实现对低质量图像的高质量恢复 现实世界中的图像恢复(IR)面临着显著的挑战,主要是缺乏高容量模型和全面的数据集。为了解决这些问题,中国科学院自动化研究所、中国科学院大学人工智能学院、字节跳动公司和中国科学技术大学的研究人员提出了一... 图像模型# DreamClear# 图像恢复模型 2周前02290
Gemstone Crafter:宝石风格的FLUX.1-dev LoRA Gemstone Crafter是一个宝石风格的FLUX.1-dev LoRA,与之前介绍的Digital Abstraction是一个作者。 地址:https://civitai.com/model... Flux衍生# FLUX.1-dev# Gemstone Crafter# Lora 2周前02040