Compress3D:从单张图片生成三维模型来自西安交通大学的研究团队推出Compress3D,它是一种从单张图片生成三维模型的方法。想象一下,你有一张你最喜欢的动漫角色的图片,你想在虚拟现实游戏中使用这个角色的三维模型。传统上,这需要3D艺术...新技术# Compress3D# 三维模型2年前04530
FlexGen框架:能够根据单一视角的图像、文本提示或两者的结合来灵活生成可控制且一致的多视图图像来自香港科技大学(广州)、香港科技大学和趣玩的研究人员开发了一个名为FlexGen的框架,它能够根据单一视角的图像、文本提示或两者的结合来灵活生成可控制且一致的多视图图像。想象一下,你给FlexGen...新技术# FlexGen1年前04520
ChatGPT 面向免费用户推出高级语音模式,但附带使用限制OpenAI今天宣布,为 ChatGPT 推出免费版本的高级语音模式。该功能基于 GPT-4o mini 模型,这是其最新模型 GPT-4o 的一种变体。这一举措旨在为更多用户提供更高效、更具交互性的...早报# ChatGPT# OpenAI# 高级语音模式10个月前04510
阿里推出角色视频合成框架MIMO:允许用户对视频中的人物进行替换阿里巴巴智能计算研究院推出MIMO,它能够根据用户提供的简单输入,合成具有可控属性(如角色、动作和场景)的逼真角色视频。简单来说,这项技术能够让用户通过提供一些基本的指令或样本,来创造出一段新的视频...新技术# MIMO# 角色视频合成# 阿里巴巴1年前04510
无需预先训练框架MotionClone:通过复制参考视频中的动作来指挥文本导向的视频生成中国科学技术大学、上海交通大学、香港中文大学和上海人工智能实验室的研究人员推出无需预先训练框架MotionClone,它能够实现一种无需训练的运动克隆,用于可控的视频生成。简单来说,这项技术可以让一个...新技术# MotionClone# 视频生成2年前04500
自适应投影引导APG:不牺牲图像质量的前提下,使用更高的指导尺度,从而生成更丰富、更真实的图像苏黎世联邦理工学院和迪士尼研究的研究人员推出自适应投影引导(APG),保留了CFG提高质量的优势,同时允许使用更高的引导比例而不产生过饱和。APG易于实现,并且实际上不会给采样过程带来额外的计算开销...新技术# APG# 自适应投影引导1年前04490
3D对象生成和重建流程PartGen:可以从文本、图像或非结构化3D对象开始,生成由多个有意义部分组成的3D对象近年来,文本到3D生成器和3D扫描仪技术取得了显著进展,能够生成高质量的3D资产。然而,这些资产通常由单一的融合表示组成,例如隐式神经场、高斯混合或网格,缺乏任何有用的结构。这种单一表示方式使得资产难...新技术# 3D对象# PartGen12个月前04480
新型视频生成技术Dr. Mo:提高视频生成的效率,同时保持或提升视频质量新型视频生成技术Dr. Mo(Diffusion Reuse MOtion),这项技术的核心在于提高视频生成的效率,同时保持或提升视频质量。研究团队的关键发现是,在早期去噪步骤中的粗粒度噪声在连续视频...新技术# Dr. Mo# 视频生成1年前04460
北京人工智能研究院推出新型图像生成模型OmniGen北京人工智能研究院推出新型图像生成模型OmniGen,与流行的扩散模型(例如,Stable Diffusion)不同,OmniGen不再需要额外的模块,如ControlNet或IP-Adapter来处...新技术# OmniGen# 图像生成模型1年前04460
ElevenLabs 发布 Eleven v3(Alpha 版),迄今最具表现力的TTS模型在语音合成技术不断进化的今天,ElevenLabs 正式推出了其最新一代文本转语音模型 —— Eleven v3(Alpha 版)。该版本在情感表达、对话自然度和多语言支持方面实现了重大突破,被誉为目...早报# Eleven v3# ElevenLabs# TTS模型7个月前04450
3D感知图像对齐技术3D Congealing:用于处理捕捉语义相似对象的2D图像集合来自斯坦福大学、谷歌研究、图宾根大学和Stability AI的研究人员推出3D Congealing,这是一种新颖的3D感知图像对齐技术,用于处理捕捉语义相似对象的2D图像集合。 项目主页 论文 简...新技术# 3D Congealing2年前04450
基于常加速度方程的普通微分方程(ODE)框架CAF:用于学习两个分布之间的映射,特别是在图像生成领域高丽大学和韩国科学技术研究院的研究人员推出新型框架Constant Acceleration Flow(CAF),它是一种基于常加速度方程的普通微分方程(ODE)框架,用于学习两个分布之间的映射,特别...新技术# CAF# 图像生成1年前04440