字节跳动推出基于Flux的通用框架UNO:支持虚拟试穿、风格化生成、产品设计等功能字节跳动近日推出了UNO,这是一个强大的通用框架,能够从单一主体到多主体进行定制化演进。UNO不仅展示了出色的泛化能力,还能将多样化的任务统一在一个模型之下,为图像生成领域带来了新的突破。 项目主页...图像模型# FLUX# UNO# 字节跳动10个月前06420
Llasa:基于LLaMA语言模型的先进文本转语音(TTS)系统文本转语音(TTS)技术正成为人机交互领域的重要工具。随着娱乐、无障碍服务、客户服务和教育等行业对语音合成的需求不断增加,市场对逼真、情感丰富且支持多种语言的语音合成技术的需求也在迅速增长。然而,传统...语音模型# Llasa# TTS12个月前06420
Stable Diffusion 原班人马新公司Black Forest Labs推出全新文生图模型Flux.1系列今年,随着Stability AI经历了一系列动荡,包括多位主要开发者离职及创始人退出,开源社区对其推出的Stable Diffusion 3 Medium模型也表示不满。在此背景下,Stable D...Flux衍生# Flux.1# Flux.1系列# Stable Diffusion12个月前06410
IDAdapter:根据单张面部照片和文本提示,生成多种风格、角度和表情的个性化图像,而无需在推理阶段进行任何微调来自北京大学、InsightFace和格灵深瞳推出IDAdapter,它能够根据单张面部照片和文本提示,生成多种风格、角度和表情的个性化图像,而无需在推理阶段进行任何微调。 论文 IDAdapter通...图像模型# IDAdapter# 个性化图像12个月前06410
Fal.ai平台推出新DiT模型AuraFlow:支持文字,百分百开源Stability AI因为Stable Diffusion 3 Medium模型的许可证问题备受诟病,虽然后来更改了许可证,但此模型在人物尤其是躺倒后人物的糟糕表现还是不受开源社区待见。不少人开始转...图像模型# AuraFlow# DiT模型# Fal.ai12个月前06400
字节跳动推出AnimateDiff-Lightning模型:根据文本描述生成视频,还可以视频转视频字节跳动推出了AnimateDiff-Lightning模型,能够更快地根据文本描述生成视频,比起原来的AnimateDiff模型,速度提升十倍以上。 模型地址:https://huggingface...视频模型# AnimateDiff-Lightning# 字节跳动12个月前06380
蓝莓真身!Black Forest Labs推出FLUX1.1 [pro]和BFL API,生成质量更高速度更快由Stable Diffusion 原班人马组成的新公司Black Forest Labs于8月份推出全新文生图模型Flux.1系列后,就迅速取代Stability AI成为AI绘画领域最出色的开源公...Flux衍生# Black Forest Labs# FLUX1.1 [pro]12个月前06260
新型图像抠图方法SEMat:能够在复杂的自然场景中实现更精确的前景对象抠图近年来,交互式分割模型(如 SAM)在图像分割任务中取得了显著进展。然而,这些模型在应用于交互式抠图任务时面临挑战,尤其是在处理复杂和遮挡场景时。现有的方法通常在合成数据上训练模型,但这些模型难以泛化...图像模型# SEMat# 图像抠图12个月前06220
线性注意力 + 恒定内存 KV 缓存!SANA-Video:高效生成分钟级高清视频的新一代文生视频模型在文本到视频(T2V)生成领域,高分辨率、长时长与低延迟三者往往难以兼得。现有大模型虽能生成高质量视频,但动辄数千秒的推理时间与高昂的训练成本严重限制了其落地应用。 为此,由英伟达、香港大学、麻省理工...视频模型# SANA-Video# 文生视频模型4个月前06170
欧美漫画及插画风格SDXL模型:CHEYENNE_CHEYENNE_是一款专门针对欧美漫画及插画风格生成的SDXL模型。不论你是专业插画家、漫画家,还是热衷于视觉艺术表达的爱好者,CHEYENNE都将为你的创意世界打开全新维度! 模型下载地址 CH...图像模型# CHEYENNE# SDXL模型# 插画12个月前06160
告别旧版,迎接进化!阿里Qwen团队发布Qwen3-235B-A22B-Instruct-2507在与社区深入交流并综合反馈后,阿里Qwen团队做出一项重要决策:停止使用混合“思维模式”(Thinking Mode)的训练方式,转而采用 Instruct 与 Thinking 模型分离训练 的新策...大语言模型# Qwen3-235B-A22B-Instruct-25076个月前06140
AnimePRO FLUX:基于 Flux.1 Shnell 的微调动漫模型AnimePRO FLUX 是一款基于 Flux.1 Shnell 的微调动漫模型,专为生成高质量的动漫图像而设计。如果你希望使用 Flux 生成动漫艺术但不想受 DEV 版本的许可限制,AnimeP...Flux衍生# AnimePRO FLUX# Flux.1 Shnell# 动漫模型12个月前06120