高效且多功能的框架Ctrl-Adapter:在各种图像和视频生成模型中加入丰富的控制功能 北卡罗来纳大学教堂山分校的研究人员推出高效且多功能的框架CTRL-Adapter,它能够为任何图像或视频扩散模型添加多样的空间控制功能。它支持多种实用的应用,如视频控制、多条件视频控制、稀疏帧条件下的... 图像模型# Ctrl-Adapter# 空间控制# 视频生成模型 2周前06470
CosmicMan:专注于生成高保真人类图像的文生图基础模型 上海人工智能实验室推出CosmicMan,这是一款专注于生成高保真人类图像的文本到图像基础模型。CosmicMan能够生成外观精细、结构合理,并且与详细描述精确对齐的逼真人类图像。 项目主页:http... 图像模型# CosmicMan# 文生图模型 2周前06430
智谱 AI 开源视频生成模型 CogVideoX-5B ,RTX 3060 显卡可运行 之前已经给大家分享了《智谱AI推出视频生成模型CogVideoX:与“清影”同源,单张 4090 显卡可推理》,之前推出的是CogVideoX-2B模型,智谱 AI又开源了CogVideoX-5B,相... 视频模型# CogVideoX-5B# 智谱 AI 2周前06350
深度求索推出新颖自回归框架 Janus: 具有图像生成功能的 13 亿多模态模型 多模态AI模型是能够理解和生成视觉内容的强大工具。然而,现有方法通常使用单一视觉编码器来处理这两项任务,这导致了由于理解和生成在本质上不同的需求而表现不佳。理解需要高层次的语义抽象,而生成则关注局部细... 多模态模型# Janus# 多模态模型 2周前06240
多语言文本编码器Glyph-ByT5-v2:提高在图形设计图像中渲染多种语言文本的准确性和美观度 来自微软亚洲研究院、清华大学、北京大学和利物浦大学的研究人员推出新型多语言视觉文本渲染技术Glyph-ByT5-v2,这是之前介绍的Glyph-ByT5升级版,此技术的目标是提高在图形设计图像中渲染多... 大语言模型# Glyph-ByT5-v2# Glyph-SDXL-v2# 文本编码器 2周前06240
新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成 来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA(Multimodal LLM Adapter),这是一个开放词汇、无需训练的个性化图像模型,具有灵活的零样本能力,专注于主体驱动的个性化... 图像模型# MoMA# 个性化图像生成# 文生图模型 2周前06240
新型文生图模型CoMat:更好地理解和执行文本描述,提高了文本到图像生成的质量和准确性 来自香港中文大学、商汤科技和上海人工智能实验室的研究人员推出新型文生图模型CoMat,这是一种具有图像到文本概念匹配机制的端到端扩散模型微调策略。开发团队借助图像字幕模型来评估图像与文本的对齐程度,并... 图像模型# CoMat# 文生图模型 2周前06040
智谱AI推出视频生成模型CogVideoX:与“清影”同源,单张 4090 显卡可推理 智谱 AI推出与“清影”同源的视频生成模型 —CogVideoX,CogVideoX模型包含多个不同尺寸大小的模型,目前将开源 CogVideoX-2B,它在 FP-16 精度下的推理需 18GB 显... 视频模型# CogVideoX# 智谱AI# 视频生成模型 2周前05960
图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能 字节跳动推出图像编辑框架ByteEdit,这是一个精心设计的创新反馈学习框架,旨在增强生成图像编辑任务的效果、提升遵从度,并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte... 图像模型# ByteEdit# 图像编辑框架 2周前05850
高级插图模型Illustrious:专门针对插画和动画任务进行了优化,主要用于生成动漫风格的图像 OnomaAI 研究小组推出一个高级插图模型Illustrious,它主要用于生成动漫风格的图像。Illustrious XL是一个基于SDXL的模型,专门针对插画和动画任务进行了优化。它是基于 Ko... 图像模型# Illustrious# Illustrious XL# 插图模型 2周前05740
Stability AI推出新模型Stable Cascade 关键要点摘要: Stable Cascade模型发布: 今天,Stability AI推出了基于Würstchen架构的文生图模型Stable Cascade,并仅允许在非商业许可下使用,限定于非商业... 图像模型# Stability AI# Stable Cascade# 模型 2周前05690
SDXL Turbo: 实时文本到图像生成模型 Stability AI于北京时间2023年11月28日推出了新的开源文生图模型 SDXL Turbo,SDXL Turbo 是在 SDXL 1.0 的基础上采用新的蒸馏方案,让模型只需要一步就可以生... 图像模型# LCM-XL# SDXL Turbo 2周前05600