用于长篇故事视觉化的迭代框架Story-Adapter:根据长篇故事的文字描述生成一系列既连贯又具有丰富细节的图像加州大学圣克鲁斯分校、杭州电子科技大学和新加坡理工学院的研究人员推出一个用于长篇故事视觉化的迭代框架Story-Adapter,Story-Adapter能够根据长篇故事的文字描述生成一系列既连贯又具...图像模型# Story-Adapter# 长篇故事视觉化10个月前08640
图像修复模型BrushNet:使用分解的双分支扩散方法来进行图像内容的恢复和编辑来自腾讯PCG ARC实验室和香港中文大学的研究团队推出新型图像修复(inpainting)模型BrushNet,它使用了分解的双分支扩散(diffusion)方法来进行图像内容的恢复和编辑。图像修复...图像模型# BrushNet# 图像修复10个月前08520
Stability AI推出全新3D模型SF3D:可在不到一秒的时间内从单张图片快速生成高质量的3D网格模型Stability AI之前与Tripo AI合作推出了图生3D模型TripoSR,Stability AI又基于TripoSR推出了Stable Fast 3D (SF3D) ,它可以在不到一秒的时...3D模型# 3D模型# SF3D# Stability AI10个月前08400
高效且多功能的框架Ctrl-Adapter:在各种图像和视频生成模型中加入丰富的控制功能北卡罗来纳大学教堂山分校的研究人员推出高效且多功能的框架CTRL-Adapter,它能够为任何图像或视频扩散模型添加多样的空间控制功能。它支持多种实用的应用,如视频控制、多条件视频控制、稀疏帧条件下的...图像模型# Ctrl-Adapter# 空间控制# 视频生成模型10个月前08340
新型超分辨率技术APISR:专门针对动漫图像和视频的高质量增强来自密歇根大学、耶鲁大学和浙江大学推出新型超分辨率技术APISR,专门针对动漫图像和视频的高质量增强。超分辨率技术(Super-Resolution, SR)是一种图像处理技术,旨在从低分辨率的图像中...图像模型# APISR# 动漫图像# 超分辨率技术10个月前08340
IC-Light推出基于Flux模型的新版本IC-Light V2:为图像进行重新打光IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出的一款控制图像照明效果的模型,之前是基于SD1.5,目前...Flux衍生# FLUX模型# IC-Light V210个月前08310
SDXL Turbo: 实时文本到图像生成模型Stability AI于北京时间2023年11月28日推出了新的开源文生图模型 SDXL Turbo,SDXL Turbo 是在 SDXL 1.0 的基础上采用新的蒸馏方案,让模型只需要一步就可以生...图像模型# LCM-XL# SDXL Turbo10个月前08210
Jasper推出新型蒸馏方法Flash Diffusion:高效、快速、多用途且与LoRA兼容,旨在加速预训练扩散模型图像生成Jasper推出了一种高效、快速、多用途且与LoRA兼容,旨在加速预训练扩散模型生成的蒸馏方法Flash Diffusion,该方法在COCO 2014和COCO 2017数据集上,针对少量步骤的图像...图像模型# Flash Diffusion# Jasper# 蒸馏模型10个月前08180
Stability AI推出新模型Stable Cascade关键要点摘要: Stable Cascade模型发布: 今天,Stability AI推出了基于Würstchen架构的文生图模型Stable Cascade,并仅允许在非商业许可下使用,限定于非商业...图像模型# Stability AI# Stable Cascade# 模型10个月前08060
智谱AI推出视频生成模型CogVideoX:与“清影”同源,单张 4090 显卡可推理智谱 AI推出与“清影”同源的视频生成模型 —CogVideoX,CogVideoX模型包含多个不同尺寸大小的模型,目前将开源 CogVideoX-2B,它在 FP-16 精度下的推理需 18GB 显...视频模型# CogVideoX# 智谱AI# 视频生成模型10个月前08040
阿里通义实验室推出 Mobile-Agent-v3 框架:为图形用户界面(GUI)任务的自动化带来了全新的解决方案在当今数字化时代,自动化技术的发展日新月异。阿里通义实验室作为行业内的创新先锋,于近期推出了令人瞩目的Mobile-Agent-v3框架,为图形用户界面(GUI)任务的自动化带来了全新的解决方案。 G...多模态模型# Mobile-Agent-v3# 图形用户界面# 通义实验室4个月前07930
Neta Lumina 发布:专为二次元创作打造的高品质图像生成模型由捏Ta实验室(Neta.art)训练的 Neta Lumina 是一款专注于二次元风格的高质量图像生成模型。此模型基于上海人工智能实验室 Alpha-VLLM 团队开源的 Lumina-Image...图像模型# Neta Lumina# 二次元5个月前07650