加速DiT架构模型的无需训练训练框架Sparse VideoGen(SVG):可实现2 倍加速和高保真度来加速视频生成加州大学伯克利分校、麻省理工学院、英伟达和清华大学的研究人员推出一个用于加速DiT架构模型的无需训练训练框架Sparse VideoGen(SVG),通过利用三维全注意力(3D full attent...新技术# Sparse VideoGen# SVG# 加速9个月前03960
通过 Trae 等 AI IDE 配置 MCP一键发布到掘金的完整指南在开发过程中,我们常常需要将自己制作的小项目(如 HTML/CSS/JS 小游戏、落地页等)快速展示给他人。如果你是掘金用户,并且使用支持 MCP(Model Calling Protocol) 的 ...教程# MCP# Trae# 掘金7个月前03950
无需训练的图像编辑技术Stable Flow:执行各种类型的图像编辑操作,包括非刚性编辑、物体添加、物体替换和全局场景编辑Snap Research、耶路撒冷希伯来大学、特拉维夫大学和赖希曼大学的研究人员推出图像编辑方法Stable Flow,这是一种无需训练的图像编辑技术,能够执行各种类型的图像编辑操作,包括非刚性编辑...新技术# Stable Flow# 图像编辑1年前03950
基于区域描述的精确布局组合文生图方法RAG:将复杂的场景分解为单独的区域,并为每个区域提供相应的文本描述,然后生成一张精确布局的图片南京大学、InstantX、Liblib AI、香港科技大学与中国移动的研究团队共同提出了一种名为RAG(Region-Aware Generation)的新方法,它是一种基于区域描述的精确布局组合文...新技术# RAG# 区域提示1年前03950
CAMI2V:引入物理约束提升文生视频模型中的相机控制精度浙江大学计算机科学与技术学院的研究团队推出一个名为CAMI2V(Camera-Controlled Image-to-Video Diffusion Model)的模型,它是一个基于扩散模型的图像到视...新技术# CAMI2V# 文生视频# 相机控制1年前03950
人像视频编辑方法PortraitGen:可以根据多模态提示对人像视频进行一致且富有表现力的编辑中国科学技术大学的研究人员推出人像视频编辑方法PortraitGen,该方法可以根据多模态提示对人像视频进行一致且富有表现力的编辑。例如,给定一段人物跳舞的视频,PortraitGen 可以根据文字提...新技术# PortraitGen# 人像视频编辑1年前03930
视频生成框架ReCamMaster:能够根据新的相机轨迹重新渲染输入视频的动态场景浙江大学、快手科技、中国香港中文大学、华中科技大学的研究人员推出一种创新的视频生成框架ReCamMaster,能够根据新的相机轨迹重新渲染输入视频的动态场景。该技术的核心在于通过预训练的文本到视频(t...新技术# ReCamMaster# 动态场景# 视频生成9个月前03910
Enhance-A-Video:利用时间注意力温度调整提升DiT架构模型的视频生成质量尽管基于DiT架构模型的视频生成技术取得了显著进展,现有模型在捕捉关键细节方面仍面临挑战。为了提高视频质量,视频增强成为一种直观的方法,其主要目标是: 保持帧间一致性:确保相邻帧之间的视觉和语义一致性...新技术# CogVideoX-2B# DiT架构模型# Enhance-A-Video1年前03910
限量版不够玩?自己DIY一个Crybaby哭娃手办,分分钟刷爆朋友圈在潮玩文化席卷全球的浪潮中,泡泡玛特(Pop Mart)旗下的 Crybaby 哭娃手办 以其独特的疗愈系形象和可爱情感表达,迅速成为年轻世代和明星圈的时尚新宠。随着数字创作风潮的兴起,Molly F...教程# Crybaby# 哭娃# 泡泡玛特8个月前03900
PhysGen3D:从一张图片创造真实物理世界的交互式3D场景清华大学、伊利诺伊大学厄巴纳香槟分校和哥伦比亚大学的研究人员携手推出了一项创新成果—PhysGen3D,将单一图像转化为非模态、以相机为中心的交互式 3D 场景。 项目主页:https://by-lu...新技术# 3D场景# PhysGen3D9个月前03900
最优步长蒸馏(OSS):通过优化采样步长来加速扩散模型的生成过程,同时保持生成质量扩散模型是一种强大的生成模型,能够生成高质量的图像、视频等内容。然而,传统的扩散模型在采样过程中需要大量的步骤来逐步去除噪声并生成最终结果,这使得采样过程计算成本高昂。例如,在生成一张高质量的图像时...新技术# OSS# 扩散模型# 最优步长蒸馏9个月前03890
MCP(开源模型上下文协议)迎来重大更新,还获得了行业巨头OpenAI和微软的支持开源模型上下文协议(MCP)的最新更新标志着AI代理与工具、数据和接口无缝交互的一个重要里程碑。这一更新不仅引入了关键升级,还获得了行业巨头OpenAI和微软的支持,显示出其在AI领域的巨大潜力和影响...百科# MCP# OpenAI# 开源模型上下文协议9个月前03890