R-Zero:首个完全自进化的推理增强框架,无需数据即可提升大模型能力由腾讯 AI 西雅图实验室、圣路易斯华盛顿大学、马里兰大学帕克分校与德克萨斯大学达拉斯分校联合提出的新框架 R-Zero,正在挑战当前大语言模型训练范式的边界。 项目主页:https://chengs...新技术# R-Zero# 推理增强框架4个月前05470
Meta推出新型视频生成模型Movie Gen:不仅能制作高清视频,还能为视频配上声音Meta宣布推出一款新AI视频生成器Movie Gen,这款工具不仅能制作高清视频,还能为视频配上声音。据Meta介绍,Movie Gen可通过简单的文字输入,自动生成全新的视频内容。此外,它还能编辑...新技术# Meta# Movie Gen# 视频生成模型1年前05460
图像逆向技术ReNoise:可能图像内容进行编辑重建来自特拉维夫大学和谷歌的研究团队推出图像逆向技术ReNoise,这是一种通过迭代噪声处理来实现真实图像在预训练扩散模型域内重建的方法。简单来说,就像我们有时候需要从一张已经损坏或者风格化的照片恢复出原...新技术# ReNoise# 图像编辑# 谷歌2年前05460
FlashTex:使用LightControlNet实现快速可重新照明的网格纹理生成来自Roblox、卡内基梅隆大学、斯坦福大学的研究人员推出FlashTex技术,它能够快速地为3D模型生成可重新照明(relittable)的纹理。这项技术的核心在于,它可以根据用户提供的文字提示,自...新技术# 3D模型# FlashTex2年前05460
新型3D生成模型GaussianCube:通过结构化表示和优化传输方法解决了传统3D高斯溅射的问题来自中国科学技术大学、清华大学和微软亚洲研究院的研究人员推出新型3D生成模型GaussianCube,它通过结构化表示和优化传输方法解决了传统3D高斯溅射的挑战,为3D内容的生成和编辑提供了一种高效且...新技术# 3D生成模型# GaussianCube2年前05450
具有光照感知能力的扩散模型Relightful Harmonization来自Adobe和纽约大学的研究人员推出具有光照感知能力的扩散模型Relightful Harmonization,这是一种先进的图像处理方法,专门用于在更换人像照片背景时,保持前景人物与新背景之间的光...新技术# Relightful Harmonization# 光影2年前05450
分布式长视频生成框架Video-Infinity:能够利用多个GPU并行工作,快速生成长时间的视频内容新加坡国立大学的研究人员推出Video-Infinity系统,它是一个分布式的长视频生成框架。简单来说,Video-Infinity能够利用多个GPU(显卡)并行工作,快速生成长时间的视频内容。这对于...新技术# Video-Infinity# 长视频生成框架1年前05430
视频运动迁移模型MotionMaster:在不需要训练的情况下,实现视频中相机运动的转移来自上海交通大学、腾讯优图实验室和哈尔滨工业大学的研究人员推出一个无需训练的视频运动迁移模型MotionMaster,它能够在不需要训练的情况下,实现视频中相机运动的转移。这意味着你可以将一个视频中的...新技术# MotionMaster# 视频运动迁移模型2年前05430
文本嵌入模型nomic-embed-text-v1:完全开源可复现Nomic AI发布文本嵌入模型nomic-embed-text-v1,这是一个开源的、可复现的、拥有8192个上下文长度的英文文本嵌入模型。这个模型在处理短文本和长文本任务上的表现超过了OpenAI...新技术# nomic-embed-text-v1# 文本嵌入模型2年前05420
首个针对 GPT-4o 图像生成能力进行定量和定性评估的基准测试GPT-ImgEval北京大学深圳研究生院、中山大学、Rabbitpre AI、上海人工智能实验室、深圳大学和香港科技大学(广州)的研究人员发布首个针对 GPT-4o 图像生成能力进行定量和定性评估的基准测试GPT-Img...新技术# GPT-4o# GPT-ImgEval9个月前05410
Adobe推出Magic Fixup:用于图像编辑的生成模型来自Adobe和马里兰大学的研究团队推出用于图像编辑的生成模型Magic Fixup,该模型能够根据粗略编辑的图像,合成遵循特定布局的逼真输出。该模型能够转移原始图像的精细细节,同时保留其各部分特...新技术# Magic Fixup# 图像编辑2年前05410
新型视频生成框架Tora:基于DiT框架构建,专门用于生成受轨迹指导的视频内容阿里巴巴推出新型视频生成框架Tora,它基于DiT(Diffusion Transformer)框架构建,专门用于生成受轨迹指导的视频内容。简而言之,Tora能够根据文本、图像、轨迹或这些元素的组合来...新技术# Tora# 视频生成1年前05390