新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

英伟达推出视频重光照技术UniRelight：通过对单张图像或视频进行光照条件的修改，实现场景在不同光照下的视觉效果呈现

英伟达、多伦多大学和Vector 研究所的研究人员发布视频重光照（relighting）技术UniRelight，通过对单张图像或视频进行光照条件的修改，实现场景在不同光照下的视觉效果呈现。项目主页...

新技术 # UniRelight # 视频重光照技术

9个月前

03800

字节跳动推出统一优化数据质量与多样性的LLM预训练框架QuaDMix

大语言模型（LLM）的性能和泛化能力在很大程度上依赖于其预训练数据的质量和多样性。然而，传统的数据整理方法往往将质量和多样性视为独立的目标，先进行质量过滤，再平衡领域分布。这种顺序优化忽略了两者之间的...

新技术 # QuaDMix # 字节跳动

11个月前

03790

DiffusionGS：单阶段3D扩散模型，实现单视图物体和场景生成

现有的前馈图像到3D的方法主要依赖于2D多视图扩散模型，这些模型在生成3D内容时存在一些显著的局限性。首先，它们无法保证3D一致性，导致在改变提示视图方向时容易崩溃。其次，这些方法主要处理以物体为中心...

新技术 # 3D模型 # DiffusionGS

1年前

03790

角色图像动画化Animate-X：基于潜在扩散模型（LDM）的通用动画框架，让图像上的角色动起来

近年来，角色图像动画技术取得了显著进展，即从参考图像和目标姿态序列生成高质量视频。然而，大多数现有方法仅适用于人体，对拟人化角色（如卡通角色、游戏角色等）的泛化效果不佳。这种限制主要归因于对运动的建模...

新技术 # Animate-X # 角色图像动画化

1年前

03790

4D 场景纹理化Tex4D：使用视频扩散模型为未纹理化的动画网格序列生成多视图、时间一致的 4D 纹理

来自香港中文大学（深圳）、NVIDIA 和加州大学默塞德分校的研究人员开发了 Tex4D，这是一种零样本方法，使用视频扩散模型为未纹理化的动画网格序列生成多视图、时间一致的 4D 纹理。简单来说，如果...

新技术 # 4D 场景 # 4D 纹理 # Tex4D

1年前

03780

英伟达联合团队提出新型连续时间流图（flow map）模型 AYF：统一扩散与流模型的少步生成方案

由英伟达、多伦多大学及矢量研究所联合提出一种新型的连续时间流图（flow map）模型Align Your Flow（AYF），显著提升扩散模型和基于流的生成模型的采样效率。这些模型虽然在图像与文本...

新技术 # Align Your Flow # AYF # 英伟达

9个月前

03760

DEER：让大模型推理更高效，动态提前退出的新方法

近年来，大型推理语言模型（LRLM）如 DeepSeek-R1 和 GPT-O1 的发展显著提升了复杂问题的解决能力。这些模型通过延长推理过程中“思维链”（Chain of Thought, CoT...

新技术 # DEER # 大模型推理

11个月前

03750

阿里Qwen项目组推出新型强化学习算法GSPO：用于训练最新 Qwen3 模型

阿里Qwen项目组推出新型强化学习算法 Group Sequence Policy Optimization (GSPO)，用于训练大型语言模型（LLMs）。与以往基于单个标记（token）重要性比率...

新技术 # GSPO # Qwen3

8个月前

03740

新型文本到图像生成系统NIRVANA：利用近似缓存技术，高效地服务基于扩散模型的文本到图像生成任务

Adobe和伊利诺伊大学厄巴纳-香槟分校的研究人员介绍了一种名为NIRVANA的新型文本到图像生成系统，它利用了一种称为近似缓存（Approximate Caching）的技术，旨在高效地服务基于扩散...

新技术 # NIRVANA # 文生图

1年前

03740

MagicDriveDiT：提高视频合成的效率和可控性，以更好地服务于自动驾驶应用

随着扩散模型的迅速发展，视频合成技术尤其是可控视频生成领域取得了重大突破，这对自动驾驶等应用具有重要意义。然而，现有的视频生成方法在处理高分辨率和长视频时面临可扩展性和控制条件整合的挑战，限制了它们在...

新技术 # MagicDriveDiT # 自动驾驶

1年前

03740

Imagine360框架：能够将标准透视视频转换为360°全景视频

香港中文大学、上海交通大学、南洋理工大学和上海人工智能实验室的研究人员推出Imagine360框架，它能够将标准透视视频转换为360°全景视频，从而为用户提供全方位的沉浸式视频体验。Imagine36...

新技术 # Imagine360 # 全景视频

1年前

03720

Textoon：基于文本描述生成Live2D格式2D卡通角色的创新方法

在数字角色创作领域，2D卡通风格因其独特的魅力而深受年轻观众的喜爱。尽管3D角色研究取得了显著进展，但交互式2D卡通角色的发展却显得相对滞后。为了解决这一问题，阿里巴巴通义实验室推出了Textoon...

新技术 # Live2D # Textoon

1年前

03710

加载更多

英伟达推出视频重光照技术UniRelight：通过对单张图像或视频进行光照条件的修改，实现场景在不同光照下的视觉效果呈现

字节跳动推出统一优化数据质量与多样性的LLM预训练框架QuaDMix

DiffusionGS：单阶段3D扩散模型，实现单视图物体和场景生成

角色图像动画化Animate-X：基于潜在扩散模型（LDM）的通用动画框架，让图像上的角色动起来

4D 场景纹理化Tex4D：使用视频扩散模型为未纹理化的动画网格序列生成多视图、时间一致的 4D 纹理

英伟达联合团队提出新型连续时间流图（flow map）模型 AYF：统一扩散与流模型的少步生成方案

DEER：让大模型推理更高效，动态提前退出的新方法

阿里Qwen项目组推出新型强化学习算法GSPO：用于训练最新 Qwen3 模型

新型文本到图像生成系统NIRVANA：利用近似缓存技术，高效地服务基于扩散模型的文本到图像生成任务

MagicDriveDiT：提高视频合成的效率和可控性，以更好地服务于自动驾驶应用

Imagine360框架：能够将标准透视视频转换为360°全景视频

Textoon：基于文本描述生成Live2D格式2D卡通角色的创新方法

新悟空

S.H.I.T

Meshy

新OpenMAIC

BotLearn

Hermes Agent

新技术

网址

新悟空

S.H.I.T

Meshy

新OpenMAIC

BotLearn

Hermes Agent