百科 | 第161页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

Adobe推出Toffee：用于主题驱动的文本到图像生成的高效数据集构建方法

Adobe Research和加州大学圣克鲁斯分校的研究人员推出Toffee系统，它是一个用于主题驱动的文本到图像生成的高效数据集构建方法。简单来说，Toffee能够创建大量的图像和文本对，这些图像能...

2年前

06390

新型图像压缩技术CMC（模态压缩）：利用大型多模态模型来实现图像到文本再到图像的转换，从而在保持图像质量的同时，大幅度减小图像的大小

上海交通大学和南洋理工大学的研究人员推出一种新型的图像压缩技术“跨模态压缩”（Cross Modality Compression，简称CMC）。这项技术的核心思想是利用大型多模态模型（Large M...

新技术 # CMC # CMC-Bench # 图像压缩

2年前

08300

扩散模型中“幻觉”（hallucinations）现象：生成了一些在训练数据中从未出现过的样本

卡内基梅隆大学和DatalogyAI的研究人员发布论文探讨扩散模型（diffusion models）中“幻觉”（hallucinations）现象，即模型生成了一些在训练数据中从未出现过的样本。这种...

新技术 # 幻觉 # 扩散模型

2年前

05720

CFG改进版CFG++：帮助生成与文本描述相匹配的图像

韩国科学技术院推出新型的图像生成和编辑技术CFG++，这是针对“分类器自由引导”（Classifier-free Guidance，简称CFG）的改进版。CFG是一种在现代文本引导的图像生成模型中使用...

百科 # CFG++# 韩国科学技术院

2年前

01,0020

文生图模型偏好优化方法MaPO（边界感知偏好优化）：让计算机在学习生成图像时，能够更好地符合人类的偏好

韩国科学技术研究院、Huggingface和高丽大学的研究人员推出一种新的文本到图像扩散模型的偏好优化方法，这种方法被称为“边界感知偏好优化”（Margin-aware Preference Opti...

新技术 # MaPO # 文生图模型 # 边界感知偏好优化

2年前

08340

OPPO推出多步潜在一致性模型MLCM：用于加速生成图像

OPPO推出多步潜在一致性模型MLCM，它用于加速生成图像的潜在扩散模型（LDMs）。简而言之，MLCM能够快速生成高质量的图像，同时保持较低的计算成本。MLCM仅需2-8步采样即可生成高质量、令人愉...

新技术 # MLCM # OPPO # 多步潜在一致性模型

2年前

05690

建立在多模态大语言模型基础上的统一文本到图像生成和检索框架TIGeR

来自新加坡国立大学 NExT++ 实验室、南洋理工大学、香港理工大学和哈尔滨工业大学（深圳）的研究人员推出一个统一的文本到图像生成和检索框架TIGeR，这个框架建立在多模态大语言模型（MLLMs）的基...

新技术 # TIGeR # 文生图

2年前

07390

新型图像生成模型家族LlamaGen：将大语言模型（Llama）应用到视觉图像生成领域

香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen，将大语言模型（Llama）中原用于文本生成的“下一个令牌预测”范式应用到了视觉图像生成领域。LlamaGen是对传统自回归模型在图...

新技术 # LlamaGen # 图像生成 # 大语言模型

2年前

06580

图生图新技术pOps：将图像和文本转换为可以相互理解的格式，更好的生成图像

特拉维夫大学和西蒙菲莎大学的研究人员推出图生图新技术pOps（Photo-Inspired Diffusion Operators），它是一种用于生成视觉内容的先进方法。例如，你想要生成一张“在海滩上...

新技术 # pOps # 图生图

2年前

06350

新型文本到视频生成框架VideoTetris：专门设计来解决现有方法在处理复杂场景（如多对象或对象数量动态变化的长视频）生成时面临的挑战

来自北京大学和快手科技的研究人员推出新型文本到视频生成框架VideoTetris，此框架专门设计来解决现有方法在处理复杂场景（如多对象或对象数量动态变化的长视频）生成时面临的挑战。VideoTetri...

新技术 # VideoTetris # 北京大学 # 快手

2年前

09090

单前向视频生成模型SF-V：通过一次前向传播快速生成高质量、运动连贯的视频

Snap和罗格斯大学的研究人员推出新型单步视频生成模型SF-V，此模型的核心特点是能够通过一次前向传播（single forward pass）快速生成高质量、运动连贯的视频，这对于需要实时视频合成和...

新技术 # SF-V # 单前向视频生成模型

2年前

07160

Follow-Your系列新框架Follow-Your-Pose v2：用于于角色图像动画的框架，可以根据一系列的动作信号（比如视频、深度图或姿势序列）生成动画视频

来自腾讯混元团队、中山大学、香港科技大学的研究人员推出Follow-Your系列新框架Follow-Your-Pose v2，这是去年发布的Follow-Your-Pose升级版，这是一个用于于角色图...

新技术 # Follow-Your-Pose v2 # 动画视频

2年前

07720

加载更多

百科