新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

视频编码器VideoPrism：能够处理多种视频理解任务，如分类、定位、检索、字幕生成和问答

来自谷歌的研究人员推出视频编码器VideoPrism，它是一个通用的视频理解模型，能够处理多种视频理解任务，如分类、定位、检索、字幕生成和问答（QA）。VideoPrism通过在一个单一的冻结模型上进...

7个月前

06930

用于生成 4D 场景（即包含时间和空间维度的视频）框架4Real-Video-V2 ：从文本提示中创建 4D 场景

Snap和阿卜杜拉国王科技大学的研究人员推出 4Real-Video-V2 框架，用于生成 4D 场景（即包含时间和空间维度的视频）。该框架能够从文本提示中创建 4D 场景，通过结合扩散模型直接生成同...

新技术 # 4Real-Video-V2

7个月前

02130

SimpleGVR：轻量高效视频超分辨率模型，让低清视频也能高清呈现

由澳门大学智慧城市物联网国家重点实验室、中国科学院深圳先进技术研究院、清华大学、快手科技和深圳理工大学联合研究团队提出了一种新型视频超分辨率（Video Super-Resolution, VSR）模...

新技术 # SimpleGVR # 视频超分辨率模型

7个月前

03940

DreamActor-H1：字节跳动推出高保真人类-产品演示视频生成框架

在电商广告、虚拟试穿、交互式媒体等场景中，如何高效生成高质量的人类-产品演示视频，一直是视觉生成领域的重要挑战。近日，字节跳动 AI 实验室提出了一种全新的视频生成框架——DreamActor-H1...

新技术 # DreamActor-H1 # 字节跳动

7个月前

02850

腾讯混元推出新型框架 Hunyuan-GameCraft：为游戏环境生成高动态、交互式的视频内容

腾讯混元项目组和华中科技大学的研究人员推出新型框架 Hunyuan-GameCraft，为游戏环境生成高动态、交互式的视频内容。Hunyuan-GameCraft 能够从单张图像和对应的提示出发，生成...

新技术 # Hunyuan-GameCraft # 腾讯混元

7个月前

03470

新型单步视频修复（VR）技术SeedVR2：通过扩散模型和对抗性后训练（APT）实现高效、高质量的视频修复和超分辨率

南洋理工大学和字节跳动的研究人员推出一种新型单步视频修复（VR）技术SeedVR2，通过扩散模型（Diffusion Model）和对抗性后训练（Adversarial Post-Training, ...

新技术 # SeedVR2 # 视频修复

7个月前

02850

InterActHuman：港中大 & 字节跳动联合推出多概念人类动画生成框架

来自香港中文大学和字节跳动的研究团队联合提出了一种新型视频生成框架 —— InterActHuman，用于生成包含多人物、人-物交互场景的高质量人类中心视频。项目主页：https://zhenzhi...

新技术 # InterActHuman # 多概念人类动画生成

7个月前

02100

LMCache：为大语言模型加速的新一代缓存系统

随着大语言模型（LLM）在各类应用场景中的广泛部署，如何提升推理效率、降低延迟、节省资源成为关键挑战。近日，开源项目 LMCache 正式亮相，它是一个专为 LLM 服务优化的高性能缓存引擎，显著降低...

新技术 # LMCache # 大语言模型 # 缓存

7个月前

03490

英伟达联合团队提出新型连续时间流图（flow map）模型 AYF：统一扩散与流模型的少步生成方案

由英伟达、多伦多大学及矢量研究所联合提出一种新型的连续时间流图（flow map）模型Align Your Flow（AYF），显著提升扩散模型和基于流的生成模型的采样效率。这些模型虽然在图像与文本...

新技术 # Align Your Flow # AYF # 英伟达

8个月前

03080

基于“幅度感知”的新型缓存机制MagCache：用于加速图像和视频扩散模型的生成过程

近年来，视频扩散模型在生成高质量视频方面取得了显著进展，但其计算成本高、推理速度慢的问题始终是落地的一大障碍。为了解决这一难题，来自北京大学和华为的研究人员在最新论文中提出了 MagCache ...

新技术 # MagCache # 幅度感知 # 模型加速

8个月前

03410

香港大学 & 达摩院等联合推出：首个第一人称现实世界模拟器 PlayerOne

由香港大学、阿里达摩院、湖畔实验室和华中科技大学联合研发的全新现实世界模拟系统 PlayerOne 正式亮相。这是首个以第一人称（egocentric）视角为核心的现实世界模拟器，标志着AI在沉浸式交...

新技术 # PlayerOne # 现实世界模拟器

8个月前

02330

苹果推出可扩展生成模型STARFlow：基于归一化流（NFs），在高分辨率图像合成方面取得了显著的成果

苹果推出了一个名为STARFlow的可扩展生成模型，它基于归一化流（Normalizing Flows，NFs），在高分辨率图像合成方面取得了显著的成果。STARFlow的主要构建块是Transfor...

新技术 # STARFlow # 可扩展生成模型

8个月前

01880

加载更多

视频编码器VideoPrism：能够处理多种视频理解任务，如分类、定位、检索、字幕生成和问答

用于生成 4D 场景（即包含时间和空间维度的视频）框架4Real-Video-V2 ：从文本提示中创建 4D 场景

SimpleGVR：轻量高效视频超分辨率模型，让低清视频也能高清呈现

DreamActor-H1：字节跳动推出高保真人类-产品演示视频生成框架

腾讯混元推出新型框架 Hunyuan-GameCraft：为游戏环境生成高动态、交互式的视频内容

新型单步视频修复（VR）技术SeedVR2：通过扩散模型和对抗性后训练（APT）实现高效、高质量的视频修复和超分辨率

InterActHuman：港中大 & 字节跳动联合推出多概念人类动画生成框架

LMCache：为大语言模型加速的新一代缓存系统

英伟达联合团队提出新型连续时间流图（flow map）模型 AYF：统一扩散与流模型的少步生成方案

基于“幅度感知”的新型缓存机制MagCache：用于加速图像和视频扩散模型的生成过程

香港大学 & 达摩院等联合推出：首个第一人称现实世界模拟器 PlayerOne

苹果推出可扩展生成模型STARFlow：基于归一化流（NFs），在高分辨率图像合成方面取得了显著的成果

新QoderWork

Clawdbot/Moltbot

CutCut

ITELLOU

Situation Monitor

中国科技云数据胶囊

新技术

网址

新QoderWork

Clawdbot/Moltbot

CutCut

ITELLOU

Situation Monitor

中国科技云数据胶囊