百度发布GenFlow3.0:文库与网盘升级多模态AI办公系统

早报3周前发布 小马良
254 0

2025年11月13日,百度世界2025大会在北京召开。会上,百度正式发布 GenFlow3.0,作为百度文库与百度网盘的底层智能体平台,该版本已完成全端上线,并同步推出两大核心智能体:Office Agent 与 GenX Agent

百度发布GenFlow3.0:文库与网盘升级多模态AI办公系统

自2024年8月发布GenFlow2.0以来,百度在不到三个月内完成版本迭代,标志着其在AI办公场景的持续投入。

GenFlow3.0:多模态与多智能体协同架构

GenFlow3.0 是一个基于中心化 Multi-Agent 架构构建的通用智能体平台,具备以下能力:

  • 全模态输入与输出:支持文本、图像、音频、视频的统一处理与生成
  • 上下文工程优化:基于行业知识图谱增强任务理解与上下文关联
  • 自研多模态融合编辑器:实现跨格式内容的可视化编辑与组合

与传统AI工具不同,GenFlow3.0 不仅响应指令,还能自主规划任务路径,并执行多步骤操作。

两大核心智能体上线

  1. Office Agent
    面向办公场景,可直接操作主流文档格式,实现:

    • Excel:复杂公式计算、条件高亮、图表自动生成
    • Word:段落格式调整、目录生成、内容增删改
    • PPT:一键美化排版、图片插入、模板适配

    用户可通过自然语言指令完成专业级编辑,例如:“将这份销售数据转为柱状图,放在第3页,标题用深蓝色”。

  2. GenX Agent
    百度称其为“行业首个全模态通用智能体”,具备:

    • 跨模态理解与生成:图文影音内容可统一处理
    • 任务拆解与工作流编排:如“收集5篇论文→总结→生成PPT→导出PDF”
    • 无需切换工具:在文库或网盘内即可完成完整创作流程

    该智能体已上线百度文库与百度网盘,用户可通过GenFlow3.0入口直接调用。

功能扩展:记忆、协作与自由画布

  • 记忆中心:记录用户历史操作、常用资料与偏好设置,支持在后续任务中自动调用,提升上下文连贯性。
  • 自由画布:支持拖拽素材、手写标注、语音指令生成文档、海报或视频,支持多人实时协同编辑。
  • 自动化管理:在百度网盘中,用户可通过指令批量重命名、移动文件,或自动整理“下载”“截图”等文件夹。

应用场景:从个人到企业

个人用户

  • AI相机2.0:整合于百度网盘,支持拍照后自动识别文档、修图、分类存储,支持错题本整理、AI讲题等学习功能。
  • 一刻相册(Magic Touch):可将静态图片转为动态效果,支持语音指令修改画面内容。
  • 橙篇平台:提供谷子(二次元)内容的AI生成、实物定制、AR预览服务,构建个性化创作社区。

企业客户
百度网盘企业版已上线五大核心Agent能力:

  • 多模态检索Agent
  • 图片生成与编辑Agent
  • Office Agent(PPT/Excel/Word)
  • 文件自动化管理Agent
  • 安全权限与审计Agent

目前已服务电商、教育、传媒等行业超125万企业客户。
案例:为“拍立享”提供“拍→传→修→享”全流程方案,实现:

  • 修图成本下降80%
  • 存储成本降低30%
  • 工作效率提升1100%

出海进展:Oreate 与全球网盘

大会首次披露百度文库与网盘的海外布局:

  • Oreate(百度文库海外版)
    采用多智能体架构,支持文档、PPT、图像、视频、播客的一站式创作。
    其核心功能包括:

    • 多模态交互式PPT生成
    • 自适应AI播客网页制作(自动生成网页播放器与字幕)
    • 完整后链路编辑(可修改内容、调整结构)

    2025年9月新版本上线后,Oreate 登顶 Product Hunt 日榜TOP1,获得欧美、东南亚、中东地区用户及KOL关注,累计用户突破百万。

  • 百度网盘全球版
    于2025年9月正式在全球市场上线,功能适配海外用户需求:

    • 多语言字幕生成
    • AI相机(文档识别、错题整理)
    • AI笔记(课堂录音转文字、重点提取)

    主要用户群体为留学生、海外研究人员,功能被反馈为“精准解决学习场景痛点”。

© 版权声明

相关文章

暂无评论

none
暂无评论...