语音驱动人脸说话生成框架AVCT来自网易伏羲AI实验室、悉尼科技大学的研究人员推出了从单人音频生成单人说话脸部的框架Audio-Visual Correlation Transformer (AVCT),它能够从单个说话者的音频-视...新技术# AVCT2年前08230
清华大学和新畅元科技推出Human4DiT:能够根据单幅图像及任意视点生成高质量、时空连贯的人类视频清华大学和新畅元科技推出新技术Human4DiT,它是一种用于生成高质量、时空一致的人类视频的4D扩散变换器(4D Diffusion Transformer)。这项技术可以从单张图片生成逼真的人类动...新技术# Human4DiT# 新畅元科技# 清华大学2年前08220
双语文本到图像生成模型Taiyi-Diffusion-XL,支持中文提示词IDEA 研究院是由沈向洋创立,他们在2021年11月22日宣布启动“封神榜”大模型开源体系。“封神榜”是由 IDEA-CCNL 的工程师、研究人员、实习生团队共同维护的一项长期开源计划。项目基于Ap...新技术# SDXL# Taiyi-Diffusion-XL# 中文提示词2年前08210
新型视频深度估计方法DepthCrafter:为开放世界(即不受限制、多样化的现实世界场景)的视频生成时间上连贯、细节丰富的深度序列腾讯人工智能实验室、香港科技大学和腾讯 PCG ARC 实验室的研究人员推出新型视频深度估计方法DepthCrafter,能够为开放世界(即不受限制、多样化的现实世界场景)的视频生成时间上连贯、细节丰...新技术# DepthCrafter# 视频深度估计1年前08200
英伟达GeForce RTX 4090 D对于AI绘画来说,其实最具“性价比”的显卡就是英伟达RTX 4090,作为英伟达民用顶级显卡,目前可运行绝大多数已开源的AI应用,以至于美国政府都对RTX 4090采取了限制措施,那就是无法出口到中国...硬件# RTX 4090# RTX 4090 D# 英伟达2年前08190
视频流翻译方法Live2Diff:专为直播视频转换设计的时间单向注意力视频扩散模型上海人工智能实验室、马克斯普朗克信息研究所和南洋理工大学的研究人员推出视频流翻译方法Live2Diff(LIVE2DIFF),它利用了单向注意力机制在视频扩散模型中,专门为直播视频流设计。这种方法的核...新技术# Live2Diff# 直播2年前08180
通用反馈学习架构ID-Aligner:用于提升文本到图像生成任务中的身份保持性能来自中山大学和字节跳动的研究人员推出通用反馈学习架构ID-Aligner,它用于提升文本到图像生成(Text-to-Image Generation)任务中的身份保持(Identity-Preserv...新技术# ID-Aligner# 人物特征# 文生图2年前08160
独特视角SDXL Lora:Head POVHead POV是一个视角SDXL Lora,这一视角的独特之处在于,它是以动物的后脑勺为观察点。尽管初版模型训练数据相对较少,可能导致生成的图片并不完美,但作者已经计划扩充数据集,并对图像位置信息进...百科# Head POV# SDXL Lora# 视角2年前08150
Stable Diffusion 3 API正式发布,还计划在不久的将来通过会员资格提供模型Stability AI宣布Stable Diffusion 3及其增强版Stable Diffusion 3 Turbo API已经正式在其开发者平台上线。根据Stability AI的声明,Sta...早报# Stable Diffusion 3 API2年前08140
新型视频生成框架ConFiner:结合多个专家模型的能力,以一种高效且无需训练的方式,生成高质量且连贯的视频内容悉尼大学、东南大学、中南大学、上海交通大学、商汤科技研究院和香港科技大学的研究人员推出新型视频生成框架ConFiner,它通过一系列现成的扩散模型专家(diffusion model experts...新技术# ConFiner# 视频生成1年前08130
视频编辑框架VideoSwap:让用户自定义视频中的主要对象(例如人物、动物或物体),同时保持背景不变来自新加坡国立大学和Meta推出视频编辑框架VideoSwap,它能够让用户自定义视频中的主要对象(例如人物、动物或物体),同时保持背景不变。你还可以通过交互式操作(如添加、删除等)进一步细化交换结果...新技术# VideoSwap# 视频编辑框架2年前08130
微调模型TCD:提高图像生成的速度和质量来自华南理工、南洋理工、北理工和悉尼大学的研究人员推出TCD(Trajectory Consistency Distillation),这是一种用于加速文生图模型图像生成的微调模型。TCD的目标是提高...新技术# TCD# 微调模型2年前08120