Yupp

6个月前发布 301 00

Yupp正式推出人类评估系统 ,邀请使用者协助评估全球逾 500 个大语言模型,包括 ChatGPT、Claude、Gemini、DeepSeek、Grok 及 Llama 等,也涵盖了必须付费订阅的各种 Pro 与 Max 模型,并根据使用者的回馈制定 Yupp AI VIBE排行榜。

所在地:
美国
收录时间:
2025-06-23

在 AI 大模型百花齐放的时代,如何判断哪个模型更适合自己?Yupp —— 这家成立于 2024 年 6 月的 AI 新创公司,近日正式推出了其核心产品:人类评估系统(Human Evaluation System),邀请全球用户参与对超过 500 个大语言模型的评估,并基于真实用户反馈生成 Yupp AI VIBE 排行榜

目前支持评估的模型包括:

  • ChatGPT、Claude、Gemini
  • Grok、Llama、DeepSeek
  • 以及各类付费订阅的 Pro 和 Max 版本模型

这个平台不仅是一个排行榜工具,更是一个通过众包方式推动 AI 模型优化的社区平台。

背后团队与融资背景

Yupp 的创始人为 Pankaj Gupta 与 Gilad Mishne,两人曾共同任职于 Twitter。他们在今年初获得由知名风投机构 Andreessen Horowitz(a16z)领投的 3,300 万美元种子轮融资,并吸引了超过 40 位来自科技界的天使投资人。

其中包括:

  • Twitter 联合创始人 Biz Stone
  • Google 首席科学家 Jeff Dean
  • Perplexity AI CEO Aravind Srinivas
  • Coinbase 法务长 Paul Grewal

这一豪华阵容也让外界对 Yupp 的未来充满期待。

用户怎么用?简单三步就能玩转 AI 模型对比

Yupp 的使用方式非常直观,也颇具趣味性:

  1. 提问:用户输入问题,平台将自动或根据设定选择两个不同 AI 模型的回答。
  2. 比较与反馈:系统展示两组回答,用户可勾选“优劣原因”,也可自由填写意见。
  3. 获取积分奖励:完成反馈后,系统会弹出一个「积分刮刮乐」界面,用户可随机获得积分奖励。

这些积分可用于:

  • 继续调用更多模型
  • 兑换加密货币或法币(平台逐步开放)

新注册用户还可直接获得 5,000 积分,开启探索之旅。

更多玩法与限制机制

  • 模型可为匿名、随机或指定,每次最多可测试 6 个模型。
  • 若用户只提问不提供反馈,系统可能会将其暂时踢出队列,确保数据质量。
  • 所有用户的提示内容默认隐私保护,除非主动分享,否则不会对外公开。

Yupp AI VIBE:不只是排行榜,更是信号源

基于海量用户的真实反馈,Yupp 推出了 AI VIBE(Vibe Intelligence BEnchmark)排行榜,从多个维度帮助用户快速了解模型表现:

  • 最受欢迎模型
  • 回应速度最快模型
  • 性价比最高模型
  • 开源模型中的佼佼者
  • 图像生成最强模型
  • 推理能力最佳模型
  • 实时响应最优模型
  • 文字理解最棒模型
  • 用户最常否定的模型

这些榜单不仅为普通用户提供参考,也为 AI 开发者和研究者提供了宝贵的数据反馈来源。

创始人怎么说?

Yupp CEO Pankaj Gupta 表示:

“我们希望通过积分机制激励高质量反馈,每个人都可以为 AI 社区做出贡献。单个用户的评价可能不够准确,但当数百万人都参与进来,就能形成强大的信号,帮助开发者改进模型。”

他强调,这种模式不仅能提升用户体验,还能推动整个 AI 生态向更加个性化、透明化方向发展。

数据统计

相关导航

暂无评论

none
暂无评论...