智谱 AI 开源视频生成模型 CogVideoX-5B ,RTX 3060 显卡可运行之前已经给大家分享了《智谱AI推出视频生成模型CogVideoX:与“清影”同源,单张 4090 显卡可推理》,之前推出的是CogVideoX-2B模型,智谱 AI又开源了CogVideoX-5B,相...视频模型# CogVideoX-5B# 智谱 AI12个月前01,0990
flux-ip-adapter-v2:基于FLUX.1-dev的风格迁移IP-Adapter 模型XLabs-AI推出了很多基于FLUX.1-dev 模型的ControlNet模型,近期XLabs-AI又推出了基于FLUX.1-dev的IP-Adapter 模型,支持支持 512 和 1024 分...Flux衍生插件# flux-ip-adapter-v2# FLUX.1-dev 模型# IP-Adapter 模型12个月前01,0810
图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能字节跳动推出图像编辑框架ByteEdit,这是一个精心设计的创新反馈学习框架,旨在增强生成图像编辑任务的效果、提升遵从度,并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte...图像模型# ByteEdit# 图像编辑框架12个月前01,0790
新型文生图模型CoMat:更好地理解和执行文本描述,提高了文本到图像生成的质量和准确性来自香港中文大学、商汤科技和上海人工智能实验室的研究人员推出新型文生图模型CoMat,这是一种具有图像到文本概念匹配机制的端到端扩散模型微调策略。开发团队借助图像字幕模型来评估图像与文本的对齐程度,并...图像模型# CoMat# 文生图模型12个月前01,0600
StabilityAI推出全新视频生成模型Stable Video 4D(SV4D):可将单个视频转化为 8 个不同角度/视图的新视图视频StabilityAI在今天推出一个新的视频生成模型Stable Video 4D(SV4D),只需 40 秒就可将单个视频转化为 8 个不同角度/视图的新视图视频(5 帧/个视角),整个 4D 优化...视频模型# StabilityAI# Stable Video 4D# SV4D12个月前01,0510
Chroma 模型家族正式发布:基于 FLUX.1-schnell,8.9亿参数开源无限制,4大分支适配不同需求开发者 lodestones 近期宣布,基于 FLUX.1-schnell 构建的 8.9 亿参数生成模型 Chroma 已完成全部基础训练,正式开放供开发者与研究者使用。作为完全遵循 Apache ...图像模型# Chroma# FLUX.1 [schnell]5个月前01,0470
多语言文本编码器Glyph-ByT5-v2:提高在图形设计图像中渲染多种语言文本的准确性和美观度来自微软亚洲研究院、清华大学、北京大学和利物浦大学的研究人员推出新型多语言视觉文本渲染技术Glyph-ByT5-v2,这是之前介绍的Glyph-ByT5升级版,此技术的目标是提高在图形设计图像中渲染多...大语言模型# Glyph-ByT5-v2# Glyph-SDXL-v2# 文本编码器12个月前01,0390
Stable Diffusion 1.5Stable Diffusion 1.5 是由 Runway ML 开发,基于 Stable Diffusion 1.2 版本,于2022年10月发布,并进行了以下改进: 使用了更大的模型:Stabl...图像模型# Runway ML# Stable Diffusion 1.5# 模型12个月前01,0350
阿里 WAN 项目组正式推出 Wan2.2:MoE 架构 + 高压缩设计,开源视频生成再进化阿里 WAN 项目组正式推出 Wan2.2,这是对 WAN 系列视频生成模型的一次重大升级。本次发布涵盖多个模型变体,全面支持文本到视频(T2V)、图像到视频(I2V)以及混合输入(TI2V)任务,在...视频模型# Wan2.2# 视频生成模型6个月前01,0330
SDXL系列新模型SDXL Flash:高速且保证质量的SDXL模型Stable Diffusion Community是一个非官方、非盈利性质的组织,它们主要目标是尽可能改进 SD 模型并让每个人都可以使用它们,近期它们推出了新的SDXL系列模型SDXL Flash...图像模型# SDXL Flash# sdxl-flash-mini# 高速模型12个月前01,0260
华为PixArt系列最新模型—PIXART-Σ:基于DiT,可直接生成4K分辨率的图像来自华为诺亚方舟实验室、大连理工大学、香港大学的研究人员推出了最新的PixArt模型—PIXART-Σ,PixArt-Σ基于Diffusion Transformer架构 (DiT,与Sora、Sta...图像模型# DiT# PIXART-Σ# 文生图模型12个月前01,0180
ToonComposer:通过生成式后关键帧(post-keyframing)阶段简化卡通制作流程香港中文大学、腾讯PCG ARC Lab和北京大学的研究人员推出 ToonComposer ,通过生成式后关键帧(post-keyframing)阶段简化卡通制作流程。传统的卡通和动画制作涉及关键帧绘...视频模型# ToonComposer# 卡通制作6个月前01,0170