小马良 - SD百科 - 第9页

微信 AI 模式识别中心推出视觉语言模型POINTS1.5系列：提升对真实世界应用的处理能力

微信 AI 模式识别中心推出视觉语言模型POINTS1.5系列：提升对真实世界应用的处理能力

微信 AI 模式识别中心推出视觉语言模型POINTS1.5系列，旨在提升对真实世界应用的处...

2周前 54

多视角视频生成新技术SynCamMaster：能够从不同的视点生成同步的、一致性高的动态场景视频

多视角视频生成新技术SynCamMaster：能够从不同的视点生成同步的、一致性高的动态场景视频

浙江大学、快手科技、清华大学和香港中文大学的研究人员推出一种用于多视角视频生...

2周前 52

用于组合式文生图新框架GraPE：将复杂的多步生成任务分解为三个独立的步骤

用于组合式文生图新框架GraPE：将复杂的多步生成任务分解为三个独立的步骤

文本到图像（T2I）生成任务的目标是从文本提示生成逼真的图像。尽管扩散模型在这一...

2周前 42

ObjCtrl-2.5D：用于图像到视频（I2V）生成中的训练无关对象控制技术

ObjCtrl-2.5D：用于图像到视频（I2V）生成中的训练无关对象控制技术

图像到视频（I2V）生成任务的目标是从单张图像生成一段连贯的视频，通常涉及对目标...

2周前 48

用于主题-风格条件图像生成新技术LoRA.rar：通过使用超网络（hypernetworks）来学习合并内容和风格的LoRAs，从而实现个性化图像的快速生成

用于主题-风格条件图像生成新技术LoRA.rar：通过使用超网络（hypernetworks）来学习合并内容和风格的LoRAs，从而实现个性化图像的快速生成

三星和帕多瓦大学的研究人员推出一种用于主题-风格条件图像生成技术LoRA.rar，通过...

2周前 38

专为DiT架构模型设计的运动转移方法DiTFlow

专为DiT架构模型设计的运动转移方法DiTFlow

牛津大学、Snap和MBZUAI的研究人员介绍了一种名为DiTFlow的方法，它是一种专为DiT...

2周前 46

高通AI研究院推出专为移动设备优化的视频编辑模型MoViE：能够在手机上实现每秒12帧的快速视频编辑

高通AI研究院推出专为移动设备优化的视频编辑模型MoViE：能够在手机上实现每秒12帧的快速视频编辑

高通AI研究院推出一个专为移动设备优化的视频编辑模型MoViE，能够在手机上实现每秒...

2周前 50

高通AI研究院推出一个为移动设备优化的视频生成模型MobileVD

高通AI研究院推出一个为移动设备优化的视频生成模型MobileVD

高通AI研究院推出了一个为移动设备优化的视频生成模型Mobile Video Diffusion（Mob...

2周前 54

解决图像生成与编辑任务的统一框架UniReal

解决图像生成与编辑任务的统一框架UniReal

图像生成和编辑任务在计算机视觉领域中具有广泛的应用，如图像合成、风格迁移、图...

2周前 46

ACDIT：介于自回归模型和扩散模型之间的插值方法，用于处理视觉信息

ACDIT：介于自回归模型和扩散模型之间的插值方法，用于处理视觉信息

清华大学和字节跳动的研究人员推出ACDIT，它是一种介于自回归模型和扩散模型之间的...

2周前 50

用于定制漫画生成的新框架DiffSensei：将多模态大语言模型和扩散模型结合起来，以实现对漫画角色形象和布局的精确控制

用于定制漫画生成的新框架DiffSensei：将多模态大语言模型和扩散模型结合起来，以实现对漫画角色形象和布局的精确控制

故事可视化，即将文本描述转化为视觉叙事的任务，近年来随着文本到图像生成模型的...

2周前 54

苹果推出用于文本和图像条件下的视频生成新方法STIV

苹果推出用于文本和图像条件下的视频生成新方法STIV

苹果公司介绍了一个名为STIV（Scalable Text and Image Conditioned Video Generat...

2周前 50

升级VIP
全屏浏览
夜间模式
返回顶部