视频模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

用于从单张图像生成灵活视角 3D 场景的框架FlexWorld：从单张图像生成具有灵活视角（如 360° 旋转和缩放）的高质量 3D 场景

中国人民大学、北京市大数据重点实验室、清华大学、北京师范大学和字节跳动的研究人员推出一种用于从单张图像生成灵活视角 3D 场景的框架FlexWorld，从单张图像生成具有灵活视角（如 360° 旋转和...

视频模型 # 3D 场景 # FlexWorld

1年前

04730

阶跃星辰开源图生视频模型 Step-Video-TI2V：30B参数，运动幅度和镜头运动可控

在2025年2月，阶跃星辰开源了两款Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。现在，阶跃星辰进一步扩展其开源贡献，推出了基于30B参数Step...

视频模型 # Step-Video-TI2V # 图生视频模型 # 阶跃星辰

1年前

02090

英伟达推出世界生成与自适应多模态控制Cosmos-Transfer1

英伟达推出了一个名为 Cosmos World Foundation Model Platform 的平台，旨在为 Physical AI（物理人工智能）提供定制化的世界模型（World Founda...

视频模型 # Cosmos-Transfer1 # 英伟达

1年前

04090

阿里通义实验室推出新型模型LHM：能够在几秒钟内从单张图像重建出可动画化的人体三维模型

阿里通义实验室推出新型模型LHM，能够在几秒钟内从单张图像重建出可动画化的人体三维模型。该模型利用多模态变换器架构，有效融合了人体位置特征和图像特征，通过注意力机制实现了几何和视觉领域的联合推理。项...

视频模型 # LHM # 阿里通义实验室

1年前

06020

潞晨科技开源视频生成模型 Open-Sora 2.0，号称性能接近 OpenAI Sora

潞晨科技宣布推出开源视频生成模型 Open-Sora 2.0，并全面开源模型权重、推理代码及分布式训练全流程。这款模型仅用 20 万美元（相当于 224 张 GPU 的计算成本）便成功训练出商业级 1...

视频模型 # Open-Sora 2.0 # OpenAI # Sora

1年前

03800

阿里通义实验室 Wan 团队推出一体化视频编辑框架 VACE

阿里通义实验室 Wan 团队近日推出了一款专为视频创建和编辑设计的一体化视频编辑框架——VACE。该框架集成了多种视频任务，包括参考到视频生成（R2V）、视频到视频编辑（V2V）和蒙版视频到视频编辑...

视频模型 # VACE # Wan # 通义实验室

1年前

05220

基于扩散模型的创新技术TrajectoryCrafter ：重新定义单目视频中的相机轨迹，能够从单目视频中推断并生成全新的视角

腾讯和香港中文大学的研究人员推出一项基于扩散模型（diffusion models）的创新技术TrajectoryCrafter ，重新定义单目视频中的相机轨迹，能够从单目视频中推断并生成全新的视角...

视频模型 # TrajectoryCrafter # 相机轨迹

1年前

02830

腾讯开源混元图生视频模型HunyuanVideo-I2V

在腾讯开源其混元视频模型HunyuanVideo之后，经过三个月的等待，腾讯终于推出了专注于图像到视频生成任务的混元图生视频模型HunyuanVideo-I2V。 GitHub：https://git...

视频模型 # HunyuanVideo-I2V # 混元图生视频模型 # 腾讯

1年前

03910

LTX-Video推出0.9.5版本：原生 ComfyUI 支持，关键帧与视频扩展增强可控性

时隔近3个月，LTX-Video再次引来更新，随着2025年3月5日发布的v0.9.5版本，LTX-Video带来了多项改进和新特性，进一步增强了用户体验。通过质量提升、功能增强和用户体验改进，LTX...

视频模型 # LTX # LTX Video # 视频生成

1年前

03480

视频抠像框架MatAnyone：实现高质量、高稳定性的视频抠像

南洋理工大学和商汤科技研究院的研究人员推出视频抠像（Video Matting）框架MatAnyone，可以实现高质量、高稳定性的视频抠像，即使在复杂的背景和多目标场景中也能保持出色的性能。MatAn...

视频模型 # MatAnyone # 视频抠像

1年前

04610

Wan2.1 GP：基于阿里视频生成模型Wan 2.1，8G显存即可生成视频

Wan2.1 GP是一个基于阿里视频生成模型Wan 2.1的优化模型，专为普通消费级显卡用户优化，降低资源需求，同时提供强大的视频生成能力。它支持多种生成任务，包括文生视频（T2V）、图生视频（I2V...

视频模型 # Wan 2.1 # Wan2.1 GP # 视频生成

1年前

02690

阿里巴巴通义实验室开源视频生成模型 Wan2.1

在AI技术的浪潮中，视频生成技术正逐渐成为新的热点。阿里巴巴集团通义实验室紧跟技术前沿，于2月21日宣布开源其先进的视频生成模型——WanX 2.1。然而，在发布过程中出现了一个小插曲，模型名称由Wa...

视频模型 # AI视频 # Wan2.1 # WanX 2.1

1年前

02530

加载更多