新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

视频插帧新技术ZeroSmooth：提升预训练视频扩散模型生成高帧率视频的能力，而无需额外的训练数据和参数更新

中国科学院大学人工智能学院、中国科学院自动化研究所模式识别新实验室和腾讯AI实验室的研究人员推出ZeroSmooth，它能够提升预训练视频扩散模型生成高帧率视频的能力，而无需额外的训练数据和参数更新...

新技术 # ZeroSmooth # 视频插帧

2年前

09560

先进的视频深度估计方法ChronoDepth：通过结合视频生成模型的先验知识，有效地提高了深度估计的准确性和时间一致性

浙江大学、博洛尼亚大学、蚂蚁集团和Rock Universe的研究人员推出一种先进的视频深度估计方法ChronoDepth，它通过结合视频生成模型的先验知识，有效地提高了深度估计的准确性和时间一致性...

新技术 # ChronoDepth # 视频深度

2年前

08670

新型图像到3D框架Unique3D：从单视图图像高效生成高质量的3D网格模型

清华大学和AVAR的研究人员推出新型图像到3D框架Unique3D，它能够从单视图图像高效生成高质量的3D网格模型。Unique3D的核心优势在于它能够在短时间内生成高保真度、细节丰富且具有强泛化能力...

新技术 # 3D网格模型 # Unique3D

2年前

01,1380

新型4D内容生成管道4Diffusion：创造全新的视角和动态场景，而不仅仅是对现有视频进行剪辑和调整

北京航空航天大学、上海人工智能实验室和香港大学的研究人员推出新型4D内容生成管道4Diffusion，它能够从单目视频生成具有空间-时间一致性的四维内容。简单来说，4Diffusion就像一个高级的视...

新技术 # 4Diffusion # 4D模型

2年前

07330

苹果推出新型图像生成模型Kaleido Diffusion：通过整合自回归的潜在先验来增强采样的图像多样性

苹果和弗吉尼亚理工大学的研究人员推出新型图像生成模型Kaleido Diffusion，此模型旨在通过自回归潜在模型（autoregressive latent modeling）提高扩散模型（dif...

新技术 # Kaleido Diffusion # 图像生成模型 # 苹果

2年前

05880

腾讯音乐娱乐推出开源虚拟人视频生成框架MusePose

腾讯音乐娱乐旗下天琴实验室推出开源虚拟人视频生成框架MusePose，MusePose 是 Muse 开源系列的最后一个组件，与 MuseV 和 MuseTalk 一起，标志着向构建端到端虚拟人物生成...

新技术 # MusePose # 虚拟人

2年前

09890

新型图像编辑框架3DitScene：通过语言引导的解耦高斯散射来实现对任何场景图像的编辑

香港中文大学、斯坦福大学、Snap、加州大学洛杉矶分校和字节跳动的研究人员推出新型图像编辑框架3DitScene，它能够通过语言引导的解耦高斯散射（Language-guided Disentangl...

新技术 # 3DitScene # 图像编辑框架

2年前

07610

文生视频新技术T2V-Turbo：快速生成高质量的视频，并且能够根据文本描述来创建视频内容

来自加州大学圣巴巴拉分校、谷歌和滑铁卢大学的研究人员推出文生视频新技术T2V-Turbo，它可以快速生成高质量的视频，并且能够根据文本描述来创建视频内容。它将来自混合的不同可微奖励模型的反馈整合到预训...

新技术 # T2V-Turbo # 文生视频

2年前

07300

阿里推出高清长视频生成方法EasyAnimate：基于Transformer架构，能够高效地制作出高质量的视频内容

阿里推出先进视频生成方法EasyAnimate，它基于Transformer架构，能够高效地制作出高质量的视频内容，目前EasyAnimate已能展现出生成包含144帧视频的能力。例如，你想要制作一段...

新技术 # EasyAnimate # 长视频生成

1年前

05250

新型可控图像动画方法MOFA-Video：能够根据给定的图像和额外的可控信号（例如人体标记、手动轨迹或提供的其他视频）或它们的组合生成视频

来自东京大学和腾讯AI实验室推出新型可控图像动画方法MOFA-Video，能够根据给定的图像和额外的可控信号（例如人体标记、手动轨迹或提供的其他视频）或它们的组合，从给定的图像中生成视频。这与以往的方...

新技术 # MOFA-Video # 可控图像动画生成

2年前

09470

JINA AI推出新型多任务对比训练方法及其模型JINA CLIP：解决现有CLIP模型在文本检索任务中性能不佳的问题

JINA AI推出新型多任务对比训练方法及其模型JINA CLIP，旨在解决现有CLIP（Contrastive Language-Image Pretraining，对比语言-图像预训练）模型在文本...

新技术 # JINA CLIP # 对比语言-图像预训练模型

2年前

05640

多模态框架MotionLLM：理解和解释人类行为，特别是通过分析人体动作和视频

清华大学、香港中文大学（深圳）、国际数字经济学院和香港科技大学的研究人员推出人工智能系统MotionLLM，它的主要任务是理解和解释人类行为，特别是通过分析人体动作和视频。例如，你有一台智能相机，它不...

新技术 # MotionLLM # 多模态框架

2年前

01,0510

加载更多