微软研究院推出新型采样策略RAS:用于加速DiT架构模型的生成过程新加坡国立大学和微软研究院的研究团队提出了一种全新的扩散采样策略——区域自适应采样 (Region-Adaptive Sampling, RAS)。这是首个允许采样率在图像不同区域间动态变化的扩散采样...新技术# RAS# 区域自适应采样# 微软研究院1年前05030
WikiAutoGen:用于自动化生成多模态维基百科风格文章的系统阿卜杜拉国王科技大学、兰州大学、悉尼大学的研究人员推出WikiAutoGen,这是一个用于自动化生成多模态维基百科风格文章的系统。它通过整合文本和图像信息,生成高质量、多模态的维基百科风格文章,同时引...新技术# WikiAutoGen# 多模态# 维基百科12个月前05020
新颖HDR视图合成技术HDR-GS:高效地生成新的HDR视角图像,并依据用户指定的曝光时间重建LDR图像约翰·霍普金斯大学、香港科技大学(广州)、清华大学和上海交通大学的研究人员推出一种新型的高动态范围(HDR)图像的新颖视图合成技术HDR-GS(High Dynamic Range Gaussian ...新技术# HDR-GS2年前05010
多功能图像到图像视觉助手PixWizard:根据自由形式的语言指令执行图像生成、编辑和转换香港中文大学MMLab、北京大学和上海人工智能实验室的研究人员推出一种多功能的图像到图像视觉助手 PixWizard,它可以根据自由形式的语言指令执行图像生成、编辑和转换。简单来说,PixWizard...新技术# PixWizard2年前05000
新型框架GVGEN:根据文本描述直接生成三维模型来自上海AI研究所、清华大学、上海交通大学、浙江大学和VAST的研究团队推出新型框架GVGEN,它能够根据文本描述直接生成三维模型。与现有的3D生成方法相比,GVGEN在定性和定量评估中均表现出卓越的...新技术# GVGEN# 三维模型2年前04980
视觉概念生成工具 Piece it Together(PiT):将用户提供的部分视觉组件无缝集成到一个连贯的整体概念中,并同时生成缺失的部分,以生成一个完整且合理的概念特拉维夫大学和Bria AI的研究人员推出一款创新的视觉概念生成工具 Piece it Together(PiT),能够将用户提供的部分视觉组件无缝集成到一个连贯的整体概念中,并同时生成缺失的部分,以...新技术# PiT# 视觉概念生成1年前04960
E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型Snap和东北大学的研究人员推出E2GAN,这是一种用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型。简单来说,E2GAN的目标是让计算机能够通过学习大量图像数据,快速生成或编辑出符合特...新技术# E2GAN# 生成对抗网络(GAN)模型2年前04950
字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准在信息过载的时代,获取“更多”并不等于“更有效”。真正制约效率的,往往不是找不到某个具体答案,而是面对海量目标时的系统性整理能力——比如,为一个行业筛选出上百家公司数据,或从成千上万条招聘信息中精准匹...新技术# WideSearch# 字节跳动# 智能体评估基准7个月前04940
微软亚洲研究院推出新框架VASA-1:基于一张静态图片和一个语音音频片段,实时生成逼真的会说话的面孔微软亚洲研究院推出新框架VASA-1,它可以根据单张静态图像和语音音频片段,生成具有吸引力的视觉情感技能(VAS)的虚拟角色栩栩如生的说话面孔。这个技术的核心在于它能够精确地捕捉到人脸的微妙动态和头部...新技术# VASA-12年前04940
帧感知视频扩散模型FVDM:时间步向量化方法,提高了视频生成任务的质量和灵活性香港城市大学、大湾区大学、国防科技大学、香港中文大学和岭南大学的研究人员推出了一种新的视频扩散模型,称为帧感知视频扩散模型(Frame-Aware Video Diffusion Model,简称FV...新技术# FVDM# 帧感知视频扩散模型1年前04930
3D网格模型生成框架AToM来自Snap、沙特阿卜杜拉国王科技大学、多伦多大学的研究人员推出一款3D模型生成框架AToM(Amortized Text-to-Mesh),AToM的核心特点是能够同时优化多个文本提示(prompt...新技术# 3D网格模型# AToM2年前04920
CFG-Zero*:用于提升基于流匹配模型的图像和视频生成效果南洋理工大学和普渡大学的研究人员推出 CFG-Zero*,即一种改进的分类器自由引导(CFG)方法,专门用于提升基于流匹配(Flow Matching)模型(如SD3模型)的图像和视频生成效果。流匹配...新技术# CFG-Zero*# CFG-Zero⋆# 分类器自由引导12个月前04910