3D服装生成框架DressCode:根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装上海科技大学、宾夕法尼亚大学、影眸科技和赜深科技推出3D服装生成框架DressCode,它能够根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装。这项技术对于数字化人类创建、时尚设计、虚拟...新技术# 3D服装生成# DressCode2年前09020
Controlnet作者新项目IC-Light:根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新开源项目,这是一款控制图像照明效果的模型,简单来说其主...新技术# controlnet# IC-Light# 打光2年前09010
零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频阳明交通大学、东京大学和联发科的研究人员推出DiffIR2VR-Zero,它能够实现零样本(zero-shot)视频恢复。零样本意味着这种方法不需要针对特定任务进行训练,就能将低质量的视频转换成高质量...新技术# DiffIR2VR-Zero# 视频恢复1年前08950
基于人类与场景互动数据集Trumans开发的动作生成模型来自北京大学人工智能研究院、BIGAI通用人工智能国家重点实验室、北京大学CFCS计算机学院和北京理工大学的研究团队创建一个详细的人类与场景互动数据集trumans,并开发出一种先进的动作生成模型,为...新技术# Trumans# 动作生成模型2年前08950
新型文本到视频生成框架VideoTetris:专门设计来解决现有方法在处理复杂场景(如多对象或对象数量动态变化的长视频)生成时面临的挑战来自北京大学和快手科技的研究人员推出新型文本到视频生成框架VideoTetris,此框架专门设计来解决现有方法在处理复杂场景(如多对象或对象数量动态变化的长视频)生成时面临的挑战。VideoTetri...新技术# VideoTetris# 北京大学# 快手2年前08930
MVEdit:用于3D对象合成和编辑的通用3D扩散适配器来自斯坦福大学、加州大学圣地亚哥分校和Apparate Labs的研究人员推出MVEdit,这是一个用于3D对象合成和编辑的通用3D扩散适配器。 项目主页 Demo GitHub MVEdit的核心功...新技术# 3D# MVEdit2年前08930
新型图像编辑框架Differential Diffusion:精确地控制图像的编辑过程来自特拉维夫大学、赖希曼大学的研究人员推出新型图像编辑框架Differential Diffusion,此框架的核心特点是能够让用户对图像的每个像素或区域进行不同程度的编辑,这在以往的图像编辑技术中是...新技术# Differential Diffusion# 图像编辑2年前08900
大语言模型适配器ELLA:提升了文生图模型处理复杂描述的能力腾讯推出大语言模型适配器(LLM Adapter)ELLA,无需 U-Net 或大语言模型训练,就可通过 ELLA ,为文生图模型增强文本对齐,解决大多数模型受限于 CLIP 本身对密集提示词的理解能...新技术# DPG-Bench# ELLA# TSC2年前08870
ComfyUI-IndexTTS2:轻量IndexTTS-2包装器实现语音克隆 + 情感控制,附安装与节点指南在 AI 音频生成领域,高质量的文本转语音(TTS)系统正从“能说”向“会表达”演进。近期,由 B站IndexTeam 推出的 IndexTTS-2 因其出色的语音克隆能力与细粒度情感控制机制受到关注...百科# ComfyUI-IndexTTS2# IndexTTS-23个月前08840
视觉语言模型CoLLaVO:提高视觉语言模型在零样本视觉语言任务中的性能韩国研究人员推出视觉语言模型CoLLaVO(Crayon Large Language and Vision mOdel),此模型旨在通过增强对象级别的图像理解能力,提高视觉语言模型(VLMs)在零样...新技术# CoLLaVO# 视觉语言模型2年前08830
负面提示词在Stable Diffusion中的作用及书写技巧在Stable Diffusion中,负面提示(Negative Prompts)作为一种图像生成的引导机制发挥着重要作用。它们使用户能够定义希望从生成的图像中排除的内容,这在避免产生模糊、失真或包含...科普# negative prompts# Stable Diffusion# 负面提示2年前08800
Genspark 推出 AI Slides功能:AI 自动生成 PPT,彻底颠覆幻灯片创作方式创建富有影响力的幻灯片一直是一项耗时且富有挑战性的任务。Genspark 宣布推出其最新创新功能——AI Slides,旨在彻底改变幻灯片的创作体验。 地址:https://www.genspark...早报# AI Slides# Genspark8个月前08780