Decart 和 Etched 联手打造的全球首个实时 AI 世界模型Oasis:完全由AI实时生成游戏场景Oasis 是由 Decart 和 Etched 联手打造的全球首个实时 AI 世界模型。这不仅仅是一个游戏,而是一个完全由 AI 实时生成的互动体验。想象一下,一个无需等待加载、始终以 20fps ...新技术# AI 世界模型# Oasis1年前04320
v0.app 正式上线:从创意到全栈应用,一个提示即可部署一个想法,如何最快变成一个真实可用的应用? 过去,这需要产品经理写文档、设计师画原型、工程师写前后端代码。而现在,只需一个自然语言提示,v0.app 就能自动生成完整的全栈应用程序——包括用户界面、内...早报# v0.app4个月前04310
深圳大学推出Attention Distillation:用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中深圳大学的研究团队介绍了一种名为 Attention Distillation (AD) 的方法,用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中。该方法通过计算预训练扩散模型中的自注...新技术# Attention Distillation# 参考图像# 深圳大学10个月前04300
FilmComposer:利用大语言模型驱动的方法为无声电影片段生成音乐上海大学和上海电影特效工程技术研究中心的研究人员推出 FilmComposer,利用大语言模型(LLM)驱动的方法为无声电影片段生成音乐。FilmComposer 旨在模拟专业音乐家的实际工作流程,结...新技术# FilmComposer# 大语言模型# 音乐9个月前04290
灵活视觉变换器FiT v2:根据给定的文本描述或已有的图像,生成高质量、高分辨率的新图像自然界的图像具有无穷的分辨率,而现有的扩散模型(如扩散变换器)在处理超出其训练领域的图像分辨率时常常面临挑战。为了解决这一限制,研究人员提出了一种新的视角,将图像概念化为具有动态大小的令牌序列,而不是...新技术# FiT v2# 灵活视觉变换器1年前04290
清华大学与瑞莱智慧联合团队推出RealSafe-R1:基于 DeepSeek R1 的安全优化大语言模型随着大语言模型(LLMs)在各个领域的广泛应用,其安全性问题日益受到关注。尽管这些模型在性能上表现出色,但在面对恶意查询和越狱攻击时,仍存在一定的风险。为了应对这一挑战,清华大学与瑞莱智慧联合团队推出...新技术# DeepSeek-R1# RealSafe-R1# 大语言模型10个月前04260
DrawingSpinUp:将单一的平面角色绘画转换成三维动画,同时保留了原始艺术作品的风格和特征香港城市大学的研究人员推出创新系统DrawingSpinUp,它能够将单一的平面角色绘画转换成三维动画,同时保留了原始艺术作品的风格和特征。这就像是给一张静态的画注入生命,让它动起来,比如让一个纸上的...新技术# DrawingSpinUp1年前04240
Warp 2.0 发布:全球首个代理开发环境来了今天,Warp 正式发布 Warp 2.0 ——全球首个代理开发环境(Agentic Development Environment,简称 ADE)。 这不是一次简单的更新,而是一次产品理念的进化:从...早报# Warp 2.0# 代理开发环境6个月前04230
开源版风格参考StyleCodes:能够将图像风格表达为一个 20 符号的 base64 代码扩散模型在图像生成方面取得了显著的成功,但如何有效地控制生成图像的风格仍然是一个挑战。虽然使用示例图像可以实现风格控制,但这种方法存在一些不便:示例图像体积较大,不易于分享,且可能涉及隐私问题。为此...新技术# Midjourney# StyleCodes# 风格参考1年前04230
结合了大语言模型与文生图模型的新框架SGEdit:用于基于场景图的精确和灵活的图像编辑场景图提供了一种结构化、层次化的图像表示方式,其中节点和边分别代表图像中的对象及其相互关系。这种方式不仅能够帮助用户更直观地理解图像内容,还能作为图像编辑的有效接口,极大提升了编辑工作的准确性和灵活性...新技术# SGEdit# 图像编辑# 大语言模型1年前04230
CoRe:用于文本到图像个性化的上下文正则化文本嵌入学习中山大学和香港理工大学的研究人员推出文本对齐新技术CoRe,它用于提升文本到图像个性化生成的效果。简单来说,CoRe技术可以帮助人工智能系统更好地理解用户通过文本提供的概念,并生成与这些概念和文本描述...新技术# CoRe1年前04230
EvolveDirector 框架:通过使用公开可用的资源来训练一个能够与高级文生图模型相媲美的模型近年来,生成模型在生成高质量图像方面取得了显著进展,但大多数模型依赖于专有的高质量数据集,并且有些模型保留了其参数,只提供可访问的应用程序编程接口(APIs)。这限制了这些模型在下游任务中的应用。为了...新技术# EvolveDirector# 文生图模型1年前04220