新型视觉生成模型RAR:在通过自回归建模提高图像生成任务的性能,同时保持与语言模型框架的完全兼容性
字节跳动推出一种新型视觉生成模型——随机自回归视觉生成(Randomized AutoRegressi...
基于常加速度方程的普通微分方程(ODE)框架CAF:用于学习两个分布之间的映射,特别是在图像生成领域
高丽大学和韩国科学技术研究院的研究人员推出新型框架Constant Acceleration Flow...
基于扩散模型的图像处理系统PromptFix:能够根据人类的指令执行各种图像处理任务,如上色、提升照片亮度、去除水印、抠图、去雾和去模糊等
扩散模型结合语言模型在图像生成任务中展现了卓越的可控性,能够根据人类指令进行...
Decart 和 Etched 联手打造的全球首个实时 AI 世界模型Oasis:完全由AI实时生成游戏场景
Oasis 是由 Decart 和 Etched 联手打造的全球首个实时 AI 世界模型。这不仅仅是一...
Unpacking SDXL Turbo: 使用稀疏自编码器来解释和理解文本到图像模型,特别是SDXL Turbo模型的内部工作机制
稀疏自编码器(SAEs)已成为逆向工程大语言模型(LLMs)的核心组成部分。SAEs通过...
新型文本到图像生成技术GrounDiT:利用DiT实现了无需训练的空间定位能力,实现更精细的用户控制
韩国科学技术研究院推出新型文本到图像生成技术GrounDiT(GROUNDIT),它通过利用D...
新型视频分词器LARP:专为自回归(AR)生成模型设计,用于提高视频生成任务的性能
马里兰大学学院公园分校的研究人员提出了一种名为LARP(Latent Aggregation and Re...