PixelWave Flux.1-Dev:基于FLUX.1-dev的微调FLUX模型,适合艺术和摄影风格PixelWave Flux.1-Dev是一个基于FLUX.1-dev的微调FLUX模型,非常适合艺术和摄影风格,黑色和深色图像输出更可靠,手部问题更少。目前已经推出了第三版,开发者推出了多个版本(S...Flux衍生# FLUX.1-dev# PixelWave Flux.1-Dev12个月前01,0110
CosmicMan:专注于生成高保真人类图像的文生图基础模型上海人工智能实验室推出CosmicMan,这是一款专注于生成高保真人类图像的文本到图像基础模型。CosmicMan能够生成外观精细、结构合理,并且与详细描述精确对齐的逼真人类图像。 项目主页:http...图像模型# CosmicMan# 文生图模型12个月前01,0080
文生图模型新架构MoA:根据用户的个性化需求生成包含特定人物的图像,同时保持原有模型的风格和多样性Snap推出新架构注意力混合(Mixture-of-Attention,简称MoA),即在个性化图像生成中实现主体与上下文解耦的注意力混合模型(MoA),用于个性化文本到图像的扩散模型。简单来说,Mo...图像模型# MoA# 文生图模型12个月前09890
卷积重建模型CRM:将一张普通的2D图片转换成一个带有纹理的3D模型清华大学、中国人民大学等团队研究人员推出卷积重建模型CRM。该模型可用于将单图像转换为3D纹理网格,可在短短10秒内就从图像中提供了高保真纹理网格,无需任何优化测试。 项目主页 GitHub Demo...3D模型# 3D模型# CRM# 重建模型12个月前09890
新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA(Multimodal LLM Adapter),这是一个开放词汇、无需训练的个性化图像模型,具有灵活的零样本能力,专注于主体驱动的个性化...图像模型# MoMA# 个性化图像生成# 文生图模型12个月前09440
基于 FLUX.1-schnell的开源、无审查的生成模型ChromaChroma 是一个基于 FLUX.1-schnell 的 8.9 亿参数生成模型,完全采用 Apache 2.0 许可证,为开发者和研究者提供一个自由、开放、无审查的工具。无论是用于艺术创作、科学研...Flux衍生# Chroma# FLUX.1 [schnell]9个月前09390
阿里通义实验室推出 Mobile-Agent-v3 框架:为图形用户界面(GUI)任务的自动化带来了全新的解决方案在当今数字化时代,自动化技术的发展日新月异。阿里通义实验室作为行业内的创新先锋,于近期推出了令人瞩目的Mobile-Agent-v3框架,为图形用户界面(GUI)任务的自动化带来了全新的解决方案。 G...多模态模型# Mobile-Agent-v3# 图形用户界面# 通义实验室5个月前09380
用于长篇故事视觉化的迭代框架Story-Adapter:根据长篇故事的文字描述生成一系列既连贯又具有丰富细节的图像加州大学圣克鲁斯分校、杭州电子科技大学和新加坡理工学院的研究人员推出一个用于长篇故事视觉化的迭代框架Story-Adapter,Story-Adapter能够根据长篇故事的文字描述生成一系列既连贯又具...图像模型# Story-Adapter# 长篇故事视觉化12个月前09280
强大且高效的图像和视频生成控制方法ControlNeXt:同时支持图像和视频,并能整合多种形式的控制信息香港中文大学和思谋科技的研究人员推出强大且高效的图像和视频生成控制方法ControlNeXt,它同时支持图像和视频,并能整合多种形式的控制信息。在这个项目中,我们提出了一种新方法,与 ControlN...图像模型# ControlNeXt12个月前09270
图生3D模型TripoSR:将2D图片转换成3D模型图生3D模型Stability AI与Tripo AI携手合作,共同推出TripoSR,这是一个灵感源自LRM(单幅图像到3D的大型重建模型)最新研究成果的快速3D对象重建模型。 模型地址:https://hug...3D模型# 3D模型# TripoSR12个月前09250
OpenCUA:首个开源的计算机使用智能体框架发布你是否曾希望有一个 AI 助手,能像你一样操作电脑——打开浏览器查资料、在 Excel 中整理数据、切换应用完成多步骤任务?如今,这类被称为“计算机使用智能体”(Computer Use Agents...多模态模型# OpenCUA# 智能体框架6个月前09220
SD3-Turbo模型:在四步无指导采样的情况下,生成与最先进的文本到图像生成器相匹配的图像质量Stability AI还没发布Stable Diffusion 3,就已经发布了SD3-Turbo的技术论文,着重介绍了LADD技术,它是一种用于加速图像合成的新型蒸馏技术。 论文地址 SD3-Tu...图像模型# SD3-Turbo# Stability AI# Stable Diffusion 312个月前09150