小马良 - SD百科 - 第4页

专注于精确角色细节转录的线稿上色模型MangaNinja

专注于精确角色细节转录的线稿上色模型MangaNinja

香港大学、香港科技大学、通义实验室和蚂蚁集团的研究人员合作推出了一款专注于精...

3周前 86

多实例生成方法3DIS-FLUX：利用最新的FLUX模型进行渲染，以实现更高质量的图像生成和更强的控制能力

多实例生成方法3DIS-FLUX：利用最新的FLUX模型进行渲染，以实现更高质量的图像生成和更强的控制能力

浙江大学和哈佛大学的研究人员推出多实例生成（Multi-Instance Generation）方法3D...

3周前 54

多模态大语言模型Omni-RGPT：在统一图像和视频的区域级理解

多模态大语言模型Omni-RGPT：在统一图像和视频的区域级理解

英伟达和延世大学的研究人员推出多模态大语言模型Omni-RGPT，旨在统一图像和视频的...

3周前 60

字节跳动推出视频生成模型训练新方法APT：通过在扩散预训练的基础上对真实数据进行对抗训练，以实现一步视频生成

字节跳动推出视频生成模型训练新方法APT：通过在扩散预训练的基础上对真实数据进行对抗训练，以实现一步视频生成

扩散模型在图像和视频生成领域展示了卓越的能力，但其迭代性质导致了生成过程缓慢...

3周前 52

字节跳动推出新型图像分词器TA-TiTok及掩码生成模型MaskGen

字节跳动推出新型图像分词器TA-TiTok及掩码生成模型MaskGen

字节跳动和浦项科技大学的研究人员提出了一种名为TA-TiTok的新型图像分词器。这是...

3周前 54

图像匹配框架MINIMA：解决跨视图和跨模态的情况下，多模态感知中的图像匹配问题

图像匹配框架MINIMA：解决跨视图和跨模态的情况下，多模态感知中的图像匹配问题

华中科技大学和武汉大学的研究人员推出一个统一的图像匹配框架MINIMA，即模态不变...

3周前 54

新型网络架构PIIP：提高视觉感知和多模态理解任务中的计算效率和性能

新型网络架构PIIP：提高视觉感知和多模态理解任务中的计算效率和性能

上海交通大学、清华大学、上海人工智能实验室、香港中文大学和商汤科技的研究人员...

3周前 56

视频生成框架RepVideo：通过重新思考跨层表示来提高文生视频模型的性能

视频生成框架RepVideo：通过重新思考跨层表示来提高文生视频模型的性能

南洋理工大学和上海人工智能实验室的研究人员推出视频生成框架RepVideo，旨在通过...

3周前 52

新型视频去噪框架Ouroboros-Diffusion：提高无调优（tuning-free）长视频生成中的结构和内容（主体）一致性

新型视频去噪框架Ouroboros-Diffusion：提高无调优（tuning-free）长视频生成中的结构和内容（主体）一致性

罗切斯特大学和智象未来的研究人员推出新型视频去噪框架Ouroboros-Diffusion，旨在...

3周前 60

SynthLight：基于扩散模型，通过模拟环境光照条件对真实人像照片进行重新照明

SynthLight：基于扩散模型，通过模拟环境光照条件对真实人像照片进行重新照明

在数字影像处理领域，耶鲁大学和Adobe研究中心联合推出了一项创新技术——SynthLight...

3周前 58

ComfyUI现已支持英伟达Cosmos：迄今为止最好的开源图生视频模型？

ComfyUI现已支持英伟达Cosmos：迄今为止最好的开源图生视频模型？

英伟达在前段时间推出Cosmos 平台，该平台包含先进的世界基础生成模型、高级分词器...

3周前 89

AnyStory：用于文本到图像生成的统一单主体和多主体个性化框架，生成具有特定主体的高保真个性化图像

AnyStory：用于文本到图像生成的统一单主体和多主体个性化框架，生成具有特定主体的高保真个性化图像

阿里巴巴通义实验室推出一个用于文本到图像生成的统一单主体和多主体个性化框架Any...

3周前 56

升级VIP
全屏浏览
夜间模式
返回顶部