人像个性化框架UniPortrait:支持单人物(Single-ID)和多人物(Multi-ID)图像的定制化生成阿里巴巴集团智能计算研究院推出人像个性化框架UniPortrait,支持单人物(Single-ID)和多人物(Multi-ID)图像的定制化生成。简单来说,UniPortrait能够根据用户提供的文本...图像模型# UniPortrait# 人像个性化12个月前07510
阿里推出 Qwen3-Coder-30B-A3B-Instruct:轻量级代码大模型,支持 256K 上下文继发布超大规模的 Qwen3-Coder-480B-A35B-Instruct 后,阿里通义千问团队近日推出一款更轻量但性能强劲的新版本: Qwen3-Coder-30B-A3B-Instruct 这...大语言模型# Qwen3-Coder-30B-A3B-Instruct# 代码大模型6个月前07500
统一框架UniFL:通过统一的反馈学习来提升稳定扩散模型(Stable Diffusion)的性能来自字节跳动和中山大学的研究人员推出利用反馈学习机制来全面增强扩散模型的统一框架UniFL,它通过统一的反馈学习来提升稳定扩散模型(Stable Diffusion)的性能。UniFL作为一种通用、高...图像模型# Stable Diffusion# UniFL12个月前07500
Shuttle 3 Diffusion:基于 Flux.1 Schnell 构建的一款微调模型,能够以简化的四步流程生成高质量的图像Shuttle 3 Diffusion 是由 ShuttleAI 基于 Flux.1 Schnell 构建的一款微调模型,能够以简化的四步流程生成高质量的图像,其表现与 Flux Dev 或 Pro ...Flux衍生# FLUX.1 [schnell]# Shuttle 3 Diffusion12个月前07430
Outfit Generator:基于FLUX.1-dev 的服装LoRAOutfit Generator是一款基于FLUX.1-dev 的服装LoRA,使用H&M服装数据集进行训练,它能够通过提示词生成复杂的服装设计,包括颜色、图案、样式、材料和类型等细节。 模型...Flux衍生# FLUX.1-dev# Outfit Generator# 服装LoRA12个月前07430
Fal.ai平台推出了新一代GAN 图像放大工具AuraSR的第二版AuraSR-v2Fal.ai平台推出了新一代GAN 图像放大工具AuraSR的第二版,上个月它们推出了AuraSR 第一版后,得到了开源社区积极回应,让他们立刻着手开发新版。AuraSR 以 Adobe 的 Giga...图像模型# AuraSR# AuraSR-v2# Fal.ai12个月前07380
Nexa AI 推出迷你视觉语言模型 OmniVision-968MNexa AI 最新发布了 OmniVision-968M,这是一款专为边缘设备设计的视觉语言模型,它通过技术创新,将图像标记数量大幅减少,显著降低了延迟和计算负担,还提升了处理速度,为边缘计算领域带...多模态模型# Nexa AI# OmniVision-968M# 视觉语言模型12个月前07350
谷歌推出新一代开源模型Gemma,轻量级高性能,助力AI创新谷歌推出开源模型Gemma,这是一款轻量级、先进的开源模型,供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸,能够在不同的设备类型上运行,包括笔记本电脑...大语言模型# Gemma# 大语言模型# 谷歌12个月前07240
以Stable Cascade为基础!新型超高分辨率图像生成方法UltraPixel:生成从1K至6K多种分辨率的高品质图像 香港科技大学(广州)、 华为诺亚方舟实验室、马克斯普朗克信息研究所和香港科技大学的研究人员推出一种新型超高分辨率图像生成方法UltraPixel,此方法是以Stability AI的模型Stable...图像模型# Stable Cascade# UltraPixel# 超高分辨率图像生成12个月前07150
Sand AI推出新型视频生成模型MAGI-1:通过自回归预测视频块序列来生成视频MAGI-1是由Sand AI研究团队开发的一种新型视频生成模型。该模型通过自回归预测视频块序列来生成视频,每个视频块由固定长度的连续帧组成。MAGI-1的核心目标是实现高保真、实时、因果一致的视频生...视频模型# MAGI-1# Sand AI# 自回归9个月前07120
新型多模态自回归模型Lumina-mGPT:能够执行各种视觉和语言任务,尤其擅长根据文本描述生成逼真的图片上海人工智能实验室和香港中文大学的研究人员推出新型多模态自回归模型Lumina-mGPT,它能够执行各种视觉和语言任务,尤其擅长根据文本描述生成逼真的图片。与现有的基于自回归的图像生成方法不同,Lum...图像模型# Lumina-mGPT# 多模态自回归模型12个月前07120
日本团队推出浮世绘风格专用生成模型Evo-Ukiyoe和浮世绘上色模型Evo-Nishikie日本AI团队Sakana AI发布了专门用于生成浮世绘风格的生成模型Evo-Ukiyoe和浮世绘上色模型Evo-Nishikie,此模型是是以转为日语打造的图像生成模型Evo-SDXL-JP为基础,通...图像模型# Evo-Nishikie# Evo-Ukiyoe# 浮世绘12个月前07110