Yupp

9个月前发布 512 00

Yupp正式推出人类评估系统，邀请使用者协助评估全球逾 500 个大语言模型，包括 ChatGPT、Claude、Gemini、DeepSeek、Grok 及 Llama 等，也涵盖了必须付费订阅的各种 Pro 与 Max 模型，并根据使用者的回馈制定 Yupp AI VIBE排行榜。

所在地：

美国

收录时间：

2025-06-23

打开网站手机查看

基准测试 # Yupp # 大语言模型

Yupp

打开网站

在 AI 大模型百花齐放的时代，如何判断哪个模型更适合自己？Yupp —— 这家成立于 2024 年 6 月的 AI 新创公司，近日正式推出了其核心产品：人类评估系统（Human Evaluation System），邀请全球用户参与对超过 500 个大语言模型的评估，并基于真实用户反馈生成 Yupp AI VIBE 排行榜。

目前支持评估的模型包括：

ChatGPT、Claude、Gemini
Grok、Llama、DeepSeek
以及各类付费订阅的 Pro 和 Max 版本模型

这个平台不仅是一个排行榜工具，更是一个通过众包方式推动 AI 模型优化的社区平台。

背后团队与融资背景

Yupp 的创始人为 Pankaj Gupta 与 Gilad Mishne，两人曾共同任职于 Twitter。他们在今年初获得由知名风投机构 Andreessen Horowitz（a16z）领投的 3,300 万美元种子轮融资，并吸引了超过 40 位来自科技界的天使投资人。

其中包括：

Twitter 联合创始人 Biz Stone
Google 首席科学家 Jeff Dean
Perplexity AI CEO Aravind Srinivas
Coinbase 法务长 Paul Grewal

这一豪华阵容也让外界对 Yupp 的未来充满期待。

用户怎么用？简单三步就能玩转 AI 模型对比

Yupp 的使用方式非常直观，也颇具趣味性：

提问：用户输入问题，平台将自动或根据设定选择两个不同 AI 模型的回答。
比较与反馈：系统展示两组回答，用户可勾选“优劣原因”，也可自由填写意见。
获取积分奖励：完成反馈后，系统会弹出一个「积分刮刮乐」界面，用户可随机获得积分奖励。

这些积分可用于：

继续调用更多模型
兑换加密货币或法币（平台逐步开放）

新注册用户还可直接获得 5,000 积分，开启探索之旅。

Yupp AI VIBE：不只是排行榜，更是信号源

基于海量用户的真实反馈，Yupp 推出了 AI VIBE（Vibe Intelligence BEnchmark）排行榜，从多个维度帮助用户快速了解模型表现：

最受欢迎模型
回应速度最快模型
性价比最高模型
开源模型中的佼佼者
图像生成最强模型
推理能力最佳模型
实时响应最优模型
文字理解最棒模型
用户最常否定的模型

这些榜单不仅为普通用户提供参考，也为 AI 开发者和研究者提供了宝贵的数据反馈来源。

创始人怎么说？

Yupp CEO Pankaj Gupta 表示：

“我们希望通过积分机制激励高质量反馈，每个人都可以为 AI 社区做出贡献。单个用户的评价可能不够准确，但当数百万人都参与进来，就能形成强大的信号，帮助开发者改进模型。”

他强调，这种模式不仅能提升用户体验，还能推动整个 AI 生态向更加个性化、透明化方向发展。

数据统计

暂无评论

暂无评论...