MCPMark

共 2 篇网址

排序

发布更新浏览点赞

MCPMark

MCPMark 的推出，填补了当前在**模型代理能力系统化评测**方面的空白。它不仅提供了一套标准化的测试框架，更强调安全性、可复现性与易用性，是推动大模型走向“可用智能体”的重要基础设施。

03840

基准测试 # MCP # MCPMark # 智能体

MCPMark

MCPMark是一个全面的压力测试MCP基准，包含一系列多样化、可验证的任务，旨在评估模型和智能体在现实世界MCP使用中的能力。MCPMark将持续更新新兴的MCP服务器，以跟上充满活力的生态系统步伐！

01460

基准测试 # MCP # MCPMark # 大语言模型