灵活视觉变换器FiT v2:根据给定的文本描述或已有的图像,生成高质量、高分辨率的新图像自然界的图像具有无穷的分辨率,而现有的扩散模型(如扩散变换器)在处理超出其训练领域的图像分辨率时常常面临挑战。为了解决这一限制,研究人员提出了一种新的视角,将图像概念化为具有动态大小的令牌序列,而不是...新技术# FiT v2# 灵活视觉变换器1年前04610
阿里推出角色视频合成框架MIMO:允许用户对视频中的人物进行替换阿里巴巴智能计算研究院推出MIMO,它能够根据用户提供的简单输入,合成具有可控属性(如角色、动作和场景)的逼真角色视频。简单来说,这项技术能够让用户通过提供一些基本的指令或样本,来创造出一段新的视频...新技术# MIMO# 角色视频合成# 阿里巴巴2年前04600
3D感知图像对齐技术3D Congealing:用于处理捕捉语义相似对象的2D图像集合来自斯坦福大学、谷歌研究、图宾根大学和Stability AI的研究人员推出3D Congealing,这是一种新颖的3D感知图像对齐技术,用于处理捕捉语义相似对象的2D图像集合。 项目主页 论文 简...新技术# 3D Congealing2年前04600
谷歌在Gemini API 中推出“隐式缓存”功能,降低模型使用成本谷歌今天在Gemini API中引入了一项名为“隐式缓存”(implicit caching)的新功能,帮助第三方开发者更经济地使用其最新的AI模型。谷歌表示,这项功能可以为通过Gemini API传...早报# Gemini API# 谷歌# 隐式缓存11个月前04590
CAMI2V:引入物理约束提升文生视频模型中的相机控制精度浙江大学计算机科学与技术学院的研究团队推出一个名为CAMI2V(Camera-Controlled Image-to-Video Diffusion Model)的模型,它是一个基于扩散模型的图像到视...新技术# CAMI2V# 文生视频# 相机控制1年前04570
DrawingSpinUp:将单一的平面角色绘画转换成三维动画,同时保留了原始艺术作品的风格和特征香港城市大学的研究人员推出创新系统DrawingSpinUp,它能够将单一的平面角色绘画转换成三维动画,同时保留了原始艺术作品的风格和特征。这就像是给一张静态的画注入生命,让它动起来,比如让一个纸上的...新技术# DrawingSpinUp2年前04570
Android 新设计曝光:Material 3 Expressive 即将登场,你的手机会变样吗?谷歌即将推出全新的 Material 3 Expressive 设计语言,这一消息因一次意外泄露而提前曝光。尽管谷歌迅速删除了相关博客文章,但互联网档案馆和科技媒体已经捕捉到了关键细节。从目前的信息来...早报# Android# Material 3 Expressive# 谷歌11个月前04560
新型视频生成技术Dr. Mo:提高视频生成的效率,同时保持或提升视频质量新型视频生成技术Dr. Mo(Diffusion Reuse MOtion),这项技术的核心在于提高视频生成的效率,同时保持或提升视频质量。研究团队的关键发现是,在早期去噪步骤中的粗粒度噪声在连续视频...新技术# Dr. Mo# 视频生成2年前04560
SimpleGVR:轻量高效视频超分辨率模型,让低清视频也能高清呈现由澳门大学智慧城市物联网国家重点实验室、中国科学院深圳先进技术研究院、清华大学、快手科技和深圳理工大学联合研究团队提出了一种新型视频超分辨率(Video Super-Resolution, VSR)模...新技术# SimpleGVR# 视频超分辨率模型10个月前04550
Yo’Chameleon:使大型多模态模型(LMM)实现个性化视觉和语言生成能力威斯康星大学麦迪逊分校和Adobe Research的研究人员推出新型框架Yo’Chameleon,为大型多模态模型(LMMs)实现个性化视觉和语言生成能力。Yo’Chameleon 通过软提示调...新技术# Yo’Chameleon# 多模态模型12个月前04550
如何在保持计算效率的同时,将原始文生图模型的多样性和控制能力转移到高效的蒸馏模型中美国东北大学的研究人员发布论文《Distilling Diversity and Control in Diffusion Models》,探讨了如何在保持计算效率的同时,将原始扩散模型的多样性和控制...新技术# 文生图模型# 蒸馏模型1年前04550
CoRe:用于文本到图像个性化的上下文正则化文本嵌入学习中山大学和香港理工大学的研究人员推出文本对齐新技术CoRe,它用于提升文本到图像个性化生成的效果。简单来说,CoRe技术可以帮助人工智能系统更好地理解用户通过文本提供的概念,并生成与这些概念和文本描述...新技术# CoRe2年前04550