Witcher Medallion:基于FLUX.1-dev 的猎魔人学院徽章Lora
Witcher Medallion是一个用于游戏《巫师》系列猎魔人学院徽章的Flux Lora,通过这...
Flux Condensation:基于FLUX.1-dev 的冷凝水画笔Lora
Flux Condensation是X上的AI绘画高手fofrAI训练的一个Flux Lora,主要用于生成由冷...
深度求索推出开源视觉模型DeepSeek-VL2 :支持动态分辨率、处理科研图表、解析各种梗图等
DeepSeek-VL2 是由深度求索(DeepSeek-AI)推出的一系列先进混合专家(MoE, Mixtur...
Sber AI 推出新一代多模态生成模型Kandinsky 4.0:包含3个视频生成模型(T2V、T2V Flash、I2V)和一个视频生成音频模型(V2A)
去年,在 AI Journey 2023 大会上,Sber AI 推出了两款引人注目的模型:用于图像生...
人体图像动画生成DisPose:从参考图像和驱动视频中生成视频,同时保持人物外观的一致性,并允许对动画进行精确控制
可控的人体图像动画旨在使用驱动视频从参考图像生成视频。为了确保运动对齐,最近...
多模态大语言模型Lyra:专注于增强多模态能力,特别是高级长语音理解、声音理解、跨模态效率和无缝语音交互
随着多模态大语言模型(MLLMs)的发展,扩展到单一领域之外的能力对于满足更通用和...
综合多模态系统InternLM-XComposer2.5-OmniLive (浦语·灵笔 2.5 OmniLive):实现实时视频和音频交互
创建能够像人类认知一样长时间与环境互动的AI系统一直是人工智能领域的长期研究目...
用于定制漫画生成的新框架DiffSensei:将多模态大语言模型和扩散模型结合起来,以实现对漫画角色形象和布局的精确控制
故事可视化,即将文本描述转化为视觉叙事的任务,近年来随着文本到图像生成模型的...