索尼推出音频-视觉生成模型Visual Echoes:根据一张图片生成与之相对应的音频,或者反过来,根据一段音频生成匹配的图片索尼推出新型音频-视觉生成模型Visual Echoes,这个模型能够根据一张图片生成与之相对应的音频,或者反过来,根据一段音频生成匹配的图片。这种技术在多模态生成领域具有很大的潜力,因为它能够将视觉...新技术# Visual Echoes# 音频-视觉生成模型2年前09510
腾讯音乐娱乐推出开源虚拟人视频生成框架MusePose腾讯音乐娱乐旗下天琴实验室推出开源虚拟人视频生成框架MusePose,MusePose 是 Muse 开源系列的最后一个组件,与 MuseV 和 MuseTalk 一起,标志着向构建端到端虚拟人物生成...新技术# MusePose# 虚拟人2年前09440
高效灵活的对象检测工具YOLO-World来自腾讯AI实验室、华中科技大学EIC学院的研究人员推出高效实时开放词汇对象检测框架YOLO-World,旨在通过视觉语言模型和大规模数据集的预训练,增强YOLO(You Only Look Once...新技术# YOLO-World# 对象检测工具# 腾讯AI实验室2年前09420
英伟达推出新型大语言模型嵌入模型NV-Embed:专门设计用于提高文本嵌入任务的性能英伟达推出新型大语言模型嵌入模型NV-Embed,NV-Embed专门设计用于提高文本嵌入任务的性能,它在多种文本嵌入任务上的表现开始超越了基于BERT或T5的嵌入模型,包括基于密集向量的检索。NV...新技术# NV-Embed# 嵌入模型2年前09410
StreamMultiDiffusion:实时交互式图像生成和编辑的工具来自韩国首尔国立大学的团队发布新应用StreamMultiDiffusion,这是一种用于实时交互式图像生成和编辑的工具,这是将之前已发布的技术 MultiDiffusion + StreamDiff...新技术# StreamMultiDiffusion# 实时生图2年前09340
自级联扩散模型Self-Cascade:快速适应高分辨率的图像和视频生成来自南洋理工大学、腾讯AI实验室、香港科技大学和克莱姆森大学的研究人员提出了一种名为自级联扩散模型(Self-Cascade Diffusion Model)的新方法,该方法利用了低分辨率模型的丰富知...新技术# Self-Cascade# 自级联扩散模型2年前09270
分辨率适配器ResAdapte:解决SD模型生成超大图片和非训练分辨率图片时的肢体异常以及画面崩坏问题字节跳动推出ResAdapter,它是一个用于SD模型的分辨率适配器,可以生成任意风格领域的图像,并且能够在不同的分辨率下保持图像的一致性和质量。 项目主页 GitHub 模型地址 简单来说,可以解决...新技术# ResAdapte# SD模型2年前09170
基于大语言模型的框架GenAgent:用于自动生成复杂的工作流程,以构建协作式人工智能系统上海人工智能实验室推出一个基于大语言模型的框架GenAgent,用于自动生成复杂的工作流程,以构建协作式人工智能(AI)系统,相比单一的大型模型,GenAgent提供了更大的灵活性和可扩展性。这种系统...新技术# GenAgent1年前09150
改进图像生成技术DMD2:通过高效的一步生成模型来加速图像生成过程,同时保持或甚至超越原始模型的质量麻省理工学院和 Adobe 研究中心的研究人员推出DMD2(Distribution Matching Distillation的改进版),这是一种改进图像合成技术,特别是针对大语言模型在图像生成...新技术# DMD2# 图像合成2年前09070
不可混合扩散Immiscible Diffusion:加速扩散模型的训练过程加州大学伯克利分校和清华大学的研究人员推出新技术“Immiscible Diffusion(不可混合扩散)”,它旨在加速扩散模型的训练过程。扩散模型是一类在图像生成领域取得显著进展的模型,但它们的训练...新技术# Immiscible Diffusion# 扩散模型1年前09060
SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力来自亚利桑那州立大学、英特尔实验室、Hugging Face和华盛顿大学的研究人员推出SPRIGHT T2I,探讨如何改进文生图(Text-to-Image,简称T2I)模型在生成图像时保持空间一致性...新技术# SPRIGHT T2I# 文生图模型2年前09060
3D服装生成框架DressCode:根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装上海科技大学、宾夕法尼亚大学、影眸科技和赜深科技推出3D服装生成框架DressCode,它能够根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装。这项技术对于数字化人类创建、时尚设计、虚拟...新技术# 3D服装生成# DressCode2年前09020