百科 | 第54页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

一种在推理阶段组合定制扩散模型的新方法TweedieMix：用于改进多概念融合在基于扩散的图像和视频生成中的应用

KRAFTON和韩国科学技术研究院AI研究生院的研究人员推出一种在推理阶段组合定制扩散模型的新方法TweedieMix，它用于改进多概念融合在基于扩散的图像和视频生成中的应用。简单来说，Tweedie...

新技术 # TweedieMix # 扩散模型

2年前

04810

IFAdapter：提升基于文本生成图像的扩散模型在生成多个实例时的精确度和细节控制能力而设计

腾讯PCG和新加坡国立大学的研究人员推出新型方法IFAdapter，它是为了提升基于文本生成图像（Text-to-Image，简称T2I）的扩散模型在生成多个实例时的精确度和细节控制能力而设计的。简单...

新技术 # IFAdapter

2年前

04810

3D生成框架ComboVerse：从单张图片中生成复杂的三维资产

来自南洋理工大学、上海人工智能实验室和香港中文大学的研究团队推出3D生成框架ComboVerse，它能够从单张图片中生成复杂的三维资产。项目主页首先，从模型和数据两个维度对“多物体差距”进行了深入...

新技术 # 3D # ComboVerse

2年前

04810

FRESCO：将输入的视频转换成具有特定风格的新视频，同时保持视频中的语义内容和动作的连贯性

来自北京大学和南洋理工大学的研究团队推出FRESCO，这是一个用于视频转换的零样本（Zero-Shot）方法。简单来说，FRESCO能够根据文本提示，将输入的视频转换成具有特定风格的新视频，同时保持视...

新技术 # FRESCO # 视频转换

2年前

04810

无需训练的个性化定制RectifID：根据用户提供的参考图像定制化地生成新图像，同时保留原始图像中的身份特征

来自北京大学、快手、电子科技大学和浙江大学的研究人员推出新型图像生成技术RectifID，它能够根据用户提供的参考图像定制化地生成新图像，同时保留原始图像中的身份特征。简单来说，这项技术可以帮助我们在...

新技术 # RectifID # 个性化定制

2年前

04800

Kimi 会员计费大升级：告别“按次计数”，迎来“统一额度”时代

Kimi 今日正式宣布对其会员权益计费方式进行重大升级。这次变革的核心在于打破功能壁垒，实现额度共享，将原本僵化的“按次计费”转变为更灵活、更公平的“按实际消耗计费”模式。官方介绍：https...

早报 # Kimi

2周前

04790

Flow-GRPO：将在线强化学习与流匹配模型相结合，用于提升文生图模型生成任务的性能

香港中文大学MM实验室、清华大学、快手科技、南京大学和上海人工智能实验室推出新方法Flow-GRPO，它将在线强化学习（Reinforcement Learning, RL）与流匹配（Flow Mat...

新技术 # Flow-GRPO # 强化学习 # 流匹配

11个月前

04790

Mistral AI旗下AI助手Le Chat 推出文件组织与协作新功能 Libraries

Mistral AI旗下AI助手Le Chat 最近推出了一项名为 Libraries 的新功能，帮助用户更高效地组织和管理文件。尽管目前仅支持 PDF 文件，结合 Mistral AI 最近发布的 ...

早报 # Le Chat # Libraries # Mistral AI

1年前

04790

可控图像到视频生成框架SG-I2V：用于在图像到视频的生成过程中实现对象和相机运动的控制

图像到视频生成技术已经取得了显著的进步，能够生成高度逼真的视频。然而，调整生成视频中的特定元素，如物体运动或相机移动，通常需要繁琐的试错过程，例如使用不同的随机种子重新生成视频。最近的技术通过微调预训...

新技术 # SG-I2V # 视频生成

1年前

04790

谷歌Gemini 正式上线“Scheduled Actions（预设操作）”功能：支持跨平台定时任务自动化

谷歌近日正式推出了 Gemini 的全新功能——“Scheduled Actions（预设操作）”，标志着其在 AI 助手领域迈出了重要一步。该功能允许用户在 Android、iOS 和网页端上，自动...

早报 # Gemini # Scheduled Actions # 谷歌

10个月前

04780

大模型 RL 加速新方案：FlashRL 实现无损量化 rollout

在大模型强化学习（RL）训练中，rollout 生成是耗时最长的环节之一。以 DAPO-32B 为例，rollout 阶段占据了约 70% 的总训练时间。这一瓶颈使得整个训练流程效率低下，尤其在大规模...

新技术 # FlashRL

8个月前

04770

基于“幅度感知”的新型缓存机制MagCache：用于加速图像和视频扩散模型的生成过程

近年来，视频扩散模型在生成高质量视频方面取得了显著进展，但其计算成本高、推理速度慢的问题始终是落地的一大障碍。为了解决这一难题，来自北京大学和华为的研究人员在最新论文中提出了 MagCache ...

新技术 # MagCache # 幅度感知 # 模型加速

10个月前

04770

加载更多

百科

一种在推理阶段组合定制扩散模型的新方法TweedieMix：用于改进多概念融合在基于扩散的图像和视频生成中的应用

IFAdapter：提升基于文本生成图像的扩散模型在生成多个实例时的精确度和细节控制能力而设计

3D生成框架ComboVerse：从单张图片中生成复杂的三维资产

FRESCO：将输入的视频转换成具有特定风格的新视频，同时保持视频中的语义内容和动作的连贯性

无需训练的个性化定制RectifID：根据用户提供的参考图像定制化地生成新图像，同时保留原始图像中的身份特征

Kimi 会员计费大升级：告别“按次计数”，迎来“统一额度”时代

Flow-GRPO：将在线强化学习与流匹配模型相结合，用于提升文生图模型生成任务的性能

Mistral AI旗下AI助手Le Chat 推出文件组织与协作新功能 Libraries

可控图像到视频生成框架SG-I2V：用于在图像到视频的生成过程中实现对象和相机运动的控制

谷歌Gemini 正式上线“Scheduled Actions（预设操作）”功能：支持跨平台定时任务自动化

大模型 RL 加速新方案：FlashRL 实现无损量化 rollout

基于“幅度感知”的新型缓存机制MagCache：用于加速图像和视频扩散模型的生成过程

S.H.I.T

ITELLOU

Tripo

同事.skill

BuildCores

pure-genealogy

百科

网址

S.H.I.T

ITELLOU

Tripo

同事.skill

BuildCores

pure-genealogy