新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

Video-RTS：一种高效视频推理框架，用强化学习+动态推理策略打破数据依赖

北卡罗来纳大学教堂山分校的研究人员提出了一种全新的视频推理方法——Video-RTS（Reinforcement Learning with Test-time Scaling），旨在解决当前视频理解...

新技术 # Video-RTS # 视频推理框架

7个月前

01470

通用图像超分辨率智能体4KAgent：将任意类型的低分辨率图像（包括自然图像、卫星图像、医学图像、AI生成内容等）提升至4K分辨率

德克萨斯农工大学、斯坦福大学、科罗拉多大学博尔德分校、德克萨斯大学奥斯汀分校、加州理工学院、加州大学默塞德分校、Snap公司和Topaz Labs公司的研究人员推出通用图像超分辨率智能体4KAgent...

新技术 # 4KAgent # 图像超分辨率

7个月前

01750

X-Planner：基于 MLLM 的图像编辑任务规划系统，让复杂指令也能精准执行

在图像编辑领域，用户常常需要执行诸如“将这张照片转换为赛博朋克风格”或“让图中的动物看起来像是在庆祝圣诞节”这样的复杂操作。这些任务不仅要求模型理解抽象指令，还需准确定位并修改图像中的特定区域。然而...

新技术 # X-Planner # 图像编辑

7个月前

03150

MUVERA：让多向量检索像单向量一样快的新一代高效算法

在 RAG（Retrieval-Augmented Generation）系统中，信息检索是决定整体性能的关键环节。传统的单向量搜索（如基于 ElasticSearch 或 FAISS 的 MIPS...

新技术 # MUVERA # 向量检索

7个月前

03710

Qwen3 MoE Fused：显著提升 Qwen3 推理速度的融合专家计算方案

Qwen3 MoE Fused 是一个面向 Qwen3 MoE 模型的高性能推理优化项目，由开发者 woct0rdho 发起并实现。该项目通过重构 MoE（Mixture of Experts）中专...

新技术 # Qwen3 MoE Fused

7个月前

03640

Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

游戏的未来不再依赖专业设计师逐帧构建，而是由每一位玩家通过想象、生成与体验来共同塑造。今天，Dynamics Lab 正式推出 Mirage —— 全球首个AI原生、实时生成的用户生成内容（UGC...

新技术 # Dynamics Lab # Mirage

7个月前

04270

字节跳动Pico团队推出新型框架EX-4D：从单目视频生成高质量的极端视角 4D 视频

字节跳动Pico团队推出新型框架EX-4D，旨在从单目视频生成高质量的极端视角 4D 视频。该框架通过深度防水网格（Depth Watertight Mesh, DW-Mesh）表示法，有效处理边界遮...

新技术 # EX-4D # 字节跳动

7个月前

02500

字节跳动推出 X-UniMotion：首个能精准复刻手部动作的视频生成模型

字节跳动研究团队发布了一项令人瞩目的视频生成新成果 —— X-UniMotion。该模型能够基于参考人物和驱动动作视频，实现对全身动作（尤其是复杂手部动作）的高精度复现，几乎看不出瑕疵，尤其在手部细节...

新技术 # X-UniMotion # 字节跳动

7个月前

03830

突破负引导瓶颈：萨里大学提出新型扩散模型控制机制 NAG

萨里大学与 NetMind.AI 的研究人员联合提出了一种名为 Normalized Attention Guidance（NAG）的新技术，解决扩散模型中“负引导”（negative guidan...

新技术 # NAG

7个月前

02160

英伟达推出视频重光照技术UniRelight：通过对单张图像或视频进行光照条件的修改，实现场景在不同光照下的视觉效果呈现

英伟达、多伦多大学和Vector 研究所的研究人员发布视频重光照（relighting）技术UniRelight，通过对单张图像或视频进行光照条件的修改，实现场景在不同光照下的视觉效果呈现。项目主页...

新技术 # UniRelight # 视频重光照技术

7个月前

03130

新型训练自由高分辨率图像生成方法HiWave：利用预训练的扩散模型生成高质量的高分辨率图像

苏黎世联邦理工学院和迪斯尼研究院的研究人员推出新型训练自由（training-free）高分辨率图像生成方法HiWave，利用预训练的扩散模型生成高质量的高分辨率图像。论文地址：https://ar...

新技术 # HiWave # 高分辨率

7个月前

01930

用于生成 4D 场景（即包含时间和空间维度的视频）框架4Real-Video-V2 ：从文本提示中创建 4D 场景

Snap和阿卜杜拉国王科技大学的研究人员推出 4Real-Video-V2 框架，用于生成 4D 场景（即包含时间和空间维度的视频）。该框架能够从文本提示中创建 4D 场景，通过结合扩散模型直接生成同...

新技术 # 4Real-Video-V2

7个月前

02130

加载更多

Video-RTS：一种高效视频推理框架，用强化学习+动态推理策略打破数据依赖

通用图像超分辨率智能体4KAgent：将任意类型的低分辨率图像（包括自然图像、卫星图像、医学图像、AI生成内容等）提升至4K分辨率

X-Planner：基于 MLLM 的图像编辑任务规划系统，让复杂指令也能精准执行

MUVERA：让多向量检索像单向量一样快的新一代高效算法

Qwen3 MoE Fused：显著提升 Qwen3 推理速度的融合专家计算方案

Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

字节跳动Pico团队推出新型框架EX-4D：从单目视频生成高质量的极端视角 4D 视频

字节跳动推出 X-UniMotion：首个能精准复刻手部动作的视频生成模型

突破负引导瓶颈：萨里大学提出新型扩散模型控制机制 NAG

英伟达推出视频重光照技术UniRelight：通过对单张图像或视频进行光照条件的修改，实现场景在不同光照下的视觉效果呈现

新型训练自由高分辨率图像生成方法HiWave：利用预训练的扩散模型生成高质量的高分辨率图像

用于生成 4D 场景（即包含时间和空间维度的视频）框架4Real-Video-V2 ：从文本提示中创建 4D 场景

新QoderWork

Clawdbot/Moltbot

CutCut

ITELLOU

Situation Monitor

中国科技云数据胶囊

新技术

网址

新QoderWork

Clawdbot/Moltbot

CutCut

ITELLOU

Situation Monitor

中国科技云数据胶囊