PPTAgent:根据文档自动化地生成高质量的演示文稿 中国科学院软件研究所中文信息处理实验室、中国科学院大学和上海捷信科技有限公司的研究人员推出新型框架PPTAgent,旨在自动化地生成高质量的演示文稿。与传统的文本到幻灯片的转换方法不同,PPTAgen... 新技术# PPTAgent 2个月前0850
新型3D感知视频扩散方法DaS:实现对视频生成过程的多样化和精确控制 香港科技大学、浙江大学、香港大学、南洋理工大学、武汉大学和德克萨斯农工大学的研究人员推出新型3D感知视频扩散方法“Diffusion as Shader(DaS)”,旨在实现对视频生成过程的多样化和精... 新技术# DaS# 视频生成 2个月前0910
新型实时一步潜在扩散模型SDXS:在图像生成任务中显著提高效率,同时保持图像质量 小米推出新型实时一步潜在扩散模型SDXS,它能够在图像生成任务中显著提高效率,同时保持图像质量。SDXS模型通过模型小型化和减少采样步骤的双重方法,显著降低了模型的延迟,使其能够在低功耗设备上实时生成... 新技术# SDXS# 一步潜在扩散模型 2个月前04470
SHMT:将不同的妆容风格精准自然地应用于给定的面部图像 武汉理工大学计算机与人工智能学院、武汉理工大学三亚科教创新园、阿里巴巴集团达摩院、湖畔实验室 和上海人工智能实验室的研究人员推出一种名为 Self-supervised Hierarchical Ma... 新技术# SHMT 2个月前0900
Nested Attention:用于在文本到图像模型中实现概念个性化 特拉维夫大学和Snap的研究人员推出一种名为 “Nested Attention” 的新机制,用于在文本到图像模型中实现概念个性化。该机制通过在模型的现有交叉注意力层中注入丰富且具有表现力的图像表示,... 新技术# Nested Attention 2个月前01030
视频修复模型SeedVR:处理任意长度和分辨率的真实世界视频修复任务 南洋理工大学和字节跳动的研究团队提出了 SeedVR,旨在解决通用视频恢复(video restoration,VR)中面临的挑战,即如何在处理未知退化的真实世界视频时,有效地恢复高质量视频并保持时间... 新技术# SeedVR# 视频修复模型 2个月前01280
华中科技大学推出VA-VAE和LightningDiT框架:在不牺牲重建质量的前提下,显著提升生成性能 华中科技大学的研究团队聚焦于潜在扩散模型(latent diffusion models)中的优化困境,即视觉分词器(visual tokenizer)中每令牌特征维度的增加虽能提升重建质量,但会降低... 新技术# LightningDiT# VA-VAE 2个月前0870
VideoRefer Suite:提升视频大语言模型对视频中时空对象的理解能力 由浙江大学和阿里巴巴达摩院的研究团队提出了VideoRefer Suite,旨在提升视频大语言模型(Video LLM)对视频中时空对象的理解能力,解决现有Video LLM在细粒度时空理解方面的不足... 新技术# VideoRefer Suite# 视频大语言模型 2个月前01050
零样本视频对象插入框架VideoAnydoor:能够在视频中高精度地插入给定对象,并且允许用户精确控制对象的运动 由香港大学和阿里巴巴达摩院等机构的研究团队推出零样本视频对象插入框架VideoAnydoor ,它能够在视频中高精度地插入给定对象,并且允许用户精确控制对象的运动。这项技术的核心挑战在于既要保留参考对... 新技术# VideoAnydoor# 视频对象插入 2个月前0950
Stability AI 推出一种基于大规模 Transformer 架构的新型音频编码模型TAAE 在语音处理领域,标记化(tokenization)是生成或理解语音的关键步骤。传统的语音编码模型通常依赖于低参数量的架构,使用具有强归纳偏置的组件,如卷积神经网络(CNN)和循环神经网络(RNN)。然... 新技术# Stability AI# TAAE 2个月前0950
虚拟脱衣TryOffAnyone:从穿着服装的人身上生成高保真平铺服装图像 多伦多大学和帕特雷大学的研究人员推出TryOffAnyone,这是一个从穿着服装的人身上生成高保真平铺服装图像的技术。这项技术对于时尚行业来说非常重要,因为它可以增强在线购物体验,提供个性化推荐、服装... 新技术# TryOffAnyone# 虚拟脱衣 2个月前01410
PERSE:从单张肖像图像创建一个可动的个性化3D生成头像 首尔国立大学的研究人员提出了一种名为PERSE的创新方法,用于从参考肖像构建可动画化、个性化的生成头像,从单张肖像图像创建一个可动的个性化3D生成头像(avatar)。PERSE 的核心优势在于它能够... 新技术# PERSE 2个月前01010