
2025年7月2日,在百度AIDAY科技开放日上,百度正式发布了其全新AI视频创作平台 “绘想” 及其核心驱动引擎——自研视频生成模型 “MuseSteamer”。这是百度在生成式AI领域继文生图、多模态大模型之后,向视频生成方向迈出的重要一步。

从初步测试结果来看,“MuseSteamer”的视频画质表现良好,手部细节生成精准,具备一定的实用潜力。但目前仍存在一定局限性,例如动作幅度控制一般,帧率较低,整体动态表现尚不及当前行业领先模型(如快手可灵2.1)。
“绘想”:集成化AI视频创作平台
“绘想”是百度推出的一站式AI视频创作平台,作为“MuseSteamer”的配套产品,旨在通过 生成式AI + 多模态技术 提供高效、便捷的视频内容生产方案。

该平台的目标是:
- 降低视频创作门槛
- 简化制作流程
- 提升企业级内容生产效率
核心功能特点:
- 图像驱动视频生成:支持从单张图片生成专业级视频内容。
- 多场景适用性:适用于搜索、广告、推荐等多样化应用场景。
- 多模态输入输出:支持图文结合等多种输入方式,增强用户交互体验。
- 企业友好型设计:面向商业用户优化,满足原生内容快速生产的实际需求。

MuseSteamer:专为企业打造的视频生成模型
“MuseSteamer”是百度自主研发的视频生成模型,专注于服务企业用户,能够基于单张图片生成最长10秒的高质量动态视频,并支持音视频一体化生成。
该模型具备以下关键能力:
功能与性能亮点:
- 支持从单张图片生成长达10秒的动态视频
- 支持音视频同步生成,提升内容完整性
- 实现电影级视觉效果,生成速度快且成本可控
- 提供三种版本:
- Turbo版:已上线“绘想”平台,提供限时免费公开测试
- Pro版:预计2025年8月上线,面向进阶使用场景
- Lite版:轻量部署版本,适用于资源受限环境
注:完整音频支持系列也将于2025年8月陆续开放。
目标用户与应用场景
“MuseSteamer”主要服务于企业客户,致力于解决传统视频制作中的两大核心问题:
- 高成本:专业视频拍摄与后期制作周期长、投入大
- 低效率:内容更新频率要求高,人工制作难以匹配节奏
因此,它特别适用于以下业务场景:
- 搜索引擎内容辅助生成
- 品牌广告短视频制作
- 电商商品展示视频
- 社交媒体推荐内容
百度希望通过这一工具,帮助企业实现从“人工+外包”到“AI自动生产”的转变,显著提升内容产出效率。
市场定位与差异化策略
与OpenAI Sora等主要面向个人用户的模型不同,MuseSteamer 更加聚焦企业市场。百度选择将重点放在国内快速增长的企业级AI服务赛道,尤其是在多媒体内容生成工具日益成为刚需的背景下。
这种“以企业为核心”的策略,不仅有助于快速形成商业化闭环,也为百度在竞争激烈的AIGC市场中开辟了新的增长点。
数据统计
相关导航


DecartAI

心响

Pika

通义万象

Hedra Studio

可灵 AI






