智谱发布全球首个面向公众的电脑智能体GLM-PC

早报2周前发布 小马良
15 0

智谱宣布推出“全球首个”面向公众开放体验的电脑智能体——GLM-PC。这款智能体能够像人类一样“观察”和“操作”计算机,帮助用户高效完成各种复杂的电脑任务。

GLM-PC的核心架构

GLM-PC的独特之处在于其“左脑”与“右脑”的设计。“左脑”专注于严谨的逻辑推理和任务执行,“右脑”则负责深度感知与交互体验。这种双脑结构让GLM-PC不仅能够理解用户的意图,还能精确地执行任务。

智谱发布全球首个面向公众的电脑智能体GLM-PC

主要功能亮点

1、任务规划与分解:根据用户需求,GLM-PC能快速制定详细的任务规划方案,并将大型任务分解为易于管理的小任务,确保每一步都有清晰的执行路径。

2、代码自动生成与执行:在规划完成后,GLM-PC会启动代码生成模块,通过逻辑循环自动推进任务直至完成。整个过程无需人工干预,实现了从输入到输出的闭环操作。

3、多场景应用实例

  • 电商购物自动化:如自动提取商品图片信息并存储至Excel,随后添加至淘宝购物车,实现一站式购物流程。
  • 社交媒体数据分析:例如从小红书中提取电影排行榜信息,并通过编写代码将其保存至本地文件系统中。
  • 个性化祝福发送:支持为微信群好友定制个性化的新春祝福语及图片/视频,并一键群发。
  • 学习辅助工具:可以自动从网站上抓取英语六级词汇,进行造句并将内容整理成Word文档供用户学习使用。

4、深度思考模式:新增了专门用于逻辑推理和代码生成的功能,增强了实时调整、反思修正以及自我纠错的能力,使得解决方案更加优化。

5、跨平台支持:除了原有的功能增强外,GLM-PC还提供了对Windows系统的支持,扩大了其适用范围。

技术背景

GLM-PC基于智谱开发的多模态大模型CogAgent构建,具备强大的图像识别、GUI理解和多模态信息融合能力。这使得它不仅能理解图形界面中的按钮、图标等元素,还能结合文字信息提供智能化的操作建议。

随着GLM-PC v1.0于2024年11月29日首次亮相并开始内测,此次更新标志着该产品向更广泛的用户群体开放的重要一步。无论是日常办公还是专业领域,GLM-PC都展示了极大的潜力,预示着未来人机交互方式的重大变革。

© 版权声明

相关文章

暂无评论

none
暂无评论...