新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

字节跳动推出 X-UniMotion：首个能精准复刻手部动作的视频生成模型

字节跳动研究团队发布了一项令人瞩目的视频生成新成果 —— X-UniMotion。该模型能够基于参考人物和驱动动作视频，实现对全身动作（尤其是复杂手部动作）的高精度复现，几乎看不出瑕疵，尤其在手部细节...

新技术 # X-UniMotion # 字节跳动

9个月前

04070

突破负引导瓶颈：萨里大学提出新型扩散模型控制机制 NAG

萨里大学与 NetMind.AI 的研究人员联合提出了一种名为 Normalized Attention Guidance（NAG）的新技术，解决扩散模型中“负引导”（negative guidan...

新技术 # NAG

10个月前

03210

英伟达推出视频重光照技术UniRelight：通过对单张图像或视频进行光照条件的修改，实现场景在不同光照下的视觉效果呈现

英伟达、多伦多大学和Vector 研究所的研究人员发布视频重光照（relighting）技术UniRelight，通过对单张图像或视频进行光照条件的修改，实现场景在不同光照下的视觉效果呈现。项目主页...

新技术 # UniRelight # 视频重光照技术

10个月前

03950

新型训练自由高分辨率图像生成方法HiWave：利用预训练的扩散模型生成高质量的高分辨率图像

苏黎世联邦理工学院和迪斯尼研究院的研究人员推出新型训练自由（training-free）高分辨率图像生成方法HiWave，利用预训练的扩散模型生成高质量的高分辨率图像。论文地址：https://ar...

新技术 # HiWave # 高分辨率

10个月前

02250

用于生成 4D 场景（即包含时间和空间维度的视频）框架4Real-Video-V2 ：从文本提示中创建 4D 场景

Snap和阿卜杜拉国王科技大学的研究人员推出 4Real-Video-V2 框架，用于生成 4D 场景（即包含时间和空间维度的视频）。该框架能够从文本提示中创建 4D 场景，通过结合扩散模型直接生成同...

新技术 # 4Real-Video-V2

10个月前

02440

SimpleGVR：轻量高效视频超分辨率模型，让低清视频也能高清呈现

由澳门大学智慧城市物联网国家重点实验室、中国科学院深圳先进技术研究院、清华大学、快手科技和深圳理工大学联合研究团队提出了一种新型视频超分辨率（Video Super-Resolution, VSR）模...

新技术 # SimpleGVR # 视频超分辨率模型

10个月前

04590

DreamActor-H1：字节跳动推出高保真人类-产品演示视频生成框架

在电商广告、虚拟试穿、交互式媒体等场景中，如何高效生成高质量的人类-产品演示视频，一直是视觉生成领域的重要挑战。近日，字节跳动 AI 实验室提出了一种全新的视频生成框架——DreamActor-H1...

新技术 # DreamActor-H1 # 字节跳动

10个月前

03170

腾讯混元推出新型框架 Hunyuan-GameCraft：为游戏环境生成高动态、交互式的视频内容

腾讯混元项目组和华中科技大学的研究人员推出新型框架 Hunyuan-GameCraft，为游戏环境生成高动态、交互式的视频内容。Hunyuan-GameCraft 能够从单张图像和对应的提示出发，生成...

新技术 # Hunyuan-GameCraft # 腾讯混元

10个月前

04180

InterActHuman：港中大 & 字节跳动联合推出多概念人类动画生成框架

来自香港中文大学和字节跳动的研究团队联合提出了一种新型视频生成框架 —— InterActHuman，用于生成包含多人物、人-物交互场景的高质量人类中心视频。项目主页：https://zhenzhi...

新技术 # InterActHuman # 多概念人类动画生成

10个月前

02390

LMCache：为大语言模型加速的新一代缓存系统

随着大语言模型（LLM）在各类应用场景中的广泛部署，如何提升推理效率、降低延迟、节省资源成为关键挑战。近日，开源项目 LMCache 正式亮相，它是一个专为 LLM 服务优化的高性能缓存引擎，显著降低...

新技术 # LMCache # 大语言模型 # 缓存

10个月前

03800

英伟达联合团队提出新型连续时间流图（flow map）模型 AYF：统一扩散与流模型的少步生成方案

由英伟达、多伦多大学及矢量研究所联合提出一种新型的连续时间流图（flow map）模型Align Your Flow（AYF），显著提升扩散模型和基于流的生成模型的采样效率。这些模型虽然在图像与文本...

新技术 # Align Your Flow # AYF # 英伟达

10个月前

03870

基于“幅度感知”的新型缓存机制MagCache：用于加速图像和视频扩散模型的生成过程

近年来，视频扩散模型在生成高质量视频方面取得了显著进展，但其计算成本高、推理速度慢的问题始终是落地的一大障碍。为了解决这一难题，来自北京大学和华为的研究人员在最新论文中提出了 MagCache ...

新技术 # MagCache # 幅度感知 # 模型加速

10个月前

04770

加载更多

字节跳动推出 X-UniMotion：首个能精准复刻手部动作的视频生成模型

突破负引导瓶颈：萨里大学提出新型扩散模型控制机制 NAG

英伟达推出视频重光照技术UniRelight：通过对单张图像或视频进行光照条件的修改，实现场景在不同光照下的视觉效果呈现

新型训练自由高分辨率图像生成方法HiWave：利用预训练的扩散模型生成高质量的高分辨率图像

用于生成 4D 场景（即包含时间和空间维度的视频）框架4Real-Video-V2 ：从文本提示中创建 4D 场景

SimpleGVR：轻量高效视频超分辨率模型，让低清视频也能高清呈现

DreamActor-H1：字节跳动推出高保真人类-产品演示视频生成框架

腾讯混元推出新型框架 Hunyuan-GameCraft：为游戏环境生成高动态、交互式的视频内容

InterActHuman：港中大 & 字节跳动联合推出多概念人类动画生成框架

LMCache：为大语言模型加速的新一代缓存系统

英伟达联合团队提出新型连续时间流图（flow map）模型 AYF：统一扩散与流模型的少步生成方案

基于“幅度感知”的新型缓存机制MagCache：用于加速图像和视频扩散模型的生成过程

ITELLOU

S.H.I.T

Tripo

TapNow

MinerU

Joker of Academics（小丑学术期刊）

新技术

网址

ITELLOU

S.H.I.T

Tripo

TapNow

MinerU

Joker of Academics（小丑学术期刊 ）

Joker of Academics（小丑学术期刊）